路 
车 
下 


等 院 校 应 用 型 创新 规划 教材 “ 。 计算 机 


Pythnon 
程序 设计 实用 教程 


毕 璐 琪 梁 润 宇 杨 阳 彭 进 香 副 主 纺 





* 以 基础 理论 一 实用 技术 一 实 训 为 主线 

* 按照 教 与 学 的 实际 需要 取材 谋 篇 

* 精心 设置 “小 型 案例 实 训 ”， 虽 在 培养 学 生 的 实践 能 

* 配备 免费 教学 资源 一 一 教学 课件 、 程 序 源 代码 、 授 课 计 划 及 
习题 答案 等 


清华 大 学 出 版 社 





全 国 高 等 院 校 应 用 型 创新 规划 教材 。 计算机 系列 


Python 程序 设计 实用 教程 


杨 连 贺 董 策 龙 房 超 主编 


毕 璐 琪 ” 梁 润 宇 杨 阳 彭 进香 副 主编 


清华 大 学 出 版 社 


北京 


内 容 简 介 


了 Python 是 一 门 简单 易学 、 功 能 强大 的 编程 语言 ， 它 内 建 了 高 效 的 数据 结构 ， 能 够 用 简单 而 又 高 效 的 方 
式 编程 。 它 优雅 的 语法 和 动态 的 类 型 ， 再 结合 它 的 解释 性 ， 使 其 成 为 在 大 多 数 平台 下 编写 脚本 或 开发 应 用 
程序 的 理想 语言 。 

本 书 系 统 而 全 面 地 介绍 了 Python 语言 的 全 部 内 容 ， 既 能 为 初学 者 夯实 基础 ， 又 适合 程序 员 提 升 技能 。 
考虑 到 近 几 年 数据 挖掘 技术 和 网 络 编程 技术 的 发 展 ， 本 书 加 入 了 Python 语言 在 科学 计算 、 网 络 编程 、 并 发 
技术 和 数据 可 视 化 方面 的 内 容 。 与 一 般 的 Python 语言 教材 相 比 ， 本 书 增加 了 许多 实际 案例 的 应 用 ， 可 以 让 
读者 更 好 地 将 Python 基础 知识 应 用 到 实际 工作 中 。 书 中 的 每 道 例题 ， 均 以 屏幕 截图 的 方式 原 滋 原 味 地 给 出 
运行 结果 ， 便 于 读者 分 析 程序 。 

本 书 可 作为 高 等 院 校 各 专业 的 Python 语言 教材 ， 亦 可 作为 软件 开发 人 员 的 参考 资料 ， 还 可 作为 读者 自 
学 Python 语言 的 参考 书 。 
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了 中 
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根据 TIOBE 网 站 的 最 新 排名 ，Python 已 超越 C#， 与 Java、C、C++ 一 起 ， 成 为 全 球 
前 四 大 流行 语言 。IEEE 发 布 的 2017 年 编程 语言 排行 榜 则 将 Python 排 在 榜首 。 

Python 也 是 美国 大 学 选用 最 多 的 语言 ， 著 名 的 哈佛 大 学 、 麻 省 理工 学 院 、 加 州 大 学 伯 
克利 分 校 、 卡 耐 基 。 梅 隆 大 学 等 ， 已 将 Python 语言 作为 计算 机 专业 和 非 计 算 机 专业 的 入 门 
语言 。Python 崇尚 简 、 短 、 精 、 小 ， 其 应 用 几乎 无 限制 ， 各 方面 地 位 超然 。Python 在 软件 
质量 控制 、 提 升 开发 效率 /可 移植 性 、 组 件 集成 、 丰 富 的 库 支 持 等 方面 ， 均 处 于 先进 地 位 。 
更 重要 的 是 ，Python 简单 易学 、 免 费 开 源 、 可 移植 、 可 扩展 、 可 媒 入 。 此 外 ，Python 还 支 
持 面向 对 象 ， 而 且 它 的 面向 对 象 甚至 比 Java 和 C# NET 更 彻底 。 

Python 是 高 “性 价 比 ”的 语言 。 它 合理 地 结合 了 高 性 能 与 低 成 本 (代码 量 小 、 维 护 成 本 
低 、 编 程 效 率 高 ) 的 特色 ， 致 力 于 用 最 简洁 、 最 简短 的 代码 完成 任务 。 

完成 同样 的 业务 逻辑 时 ， 在 其 他 编程 语言 中 可 能 需要 编写 大 量 的 代码 ， 而 在 Python 中 
只 需要 调用 内 建 函数 或 内 建 对 象 的 方法 即 可 实现 ， 甚 至 可 以 直接 调用 第 三 方 扩展 库 来 完 
成 。 一 般 情况 下 ，Python 的 代码 量 仅仅 是 Java 的 5， 足见 Python 编程 的 高 效 。 

Python 是 应 用 “无 限制 ”的 语言 。 它 被 广泛 应 用 于 后 端 开发 、 游 戏 开发 、 网 站 开发 、 
科学 计算 、 大 数据 分 析 、 云 计算 、 图 形 开 发 等 领域 。 美 国 中 央 情 报 局 CIA 网 站 、 世 界 上 最 
大 的 视频 网 站 YouTube、 国 内 最 大 的 问答 社区 “ 知 乎 ”等 ， 都 是 用 Python 开发 的 ， 搜 狐 、 
人 金山、 腾讯、 盛大、 网易、 百度、 阿里 、 淘 宝 、 土 豆 、 新 浪 、 果 壳 等 著名 的 IT 公司 都 在 
使 用 Python 完成 各 种 各 样 的 任务 。 

Python 是 一 种 代表 “简单 主义 ”思想 的 语言 。 它 的 设计 哲学 是 优雅 、 明 确 、 简 单 。 阅 
读 一 个 良好 的 Python 程序 ， 感 觉 就 像 是 在 阅读 英语 ， 尽 管 这 个 英语 的 要 求 非常 严格 ! 
Python 的 这 种 伪 代 码 本 质 ， 是 它 最 大 的 优点 之 一 。 

Python 是 “高 层次 ”的 语言 。 它 内 建 优异 的 数据 结构 ， 很 容易 表达 各 种 常见 的 数据 结 
构 ， 不 再 需要 定义 指针 、 分 配 内 存 ， 编 程 也 简单 了 许多 ， 也 无 须 考 虑 程序 对 内 存 的 使 用 等 
底层 细节 ， 把 许多 机 器 层面 上 的 细节 隐藏 起 来 ， 凸 显 出 逻辑 层面 的 编程 思考 。 

Python 是 免费 、 开 源 、 跨 平台 的 高 级 动态 编程 语言 。 它 支持 命令 式 编程 、 函 数 式 编 
程 ， 全 面 支持 面向 对 象 编程 ， 它 语法 简洁 、 清 晰 ， 拥 有 功能 丰富 而 强大 的 标准 库 和 大 量 的 
第 三 方 扩展 库 ， 它 使 用 户 能 够 专注 于 解决 问题 ， 而 不 是 去 搞 明 白 语言 本 身 ， 这 是 它 开发 效 
率 高 的 根本 原因 。 

由 此 可 见 ， 用 “出 类 拔 茜 ” 来 形容 Python 并 不 为 过 。Python 以 如 此 众多 的 优势 ， 吸 引 
着 无 数 程序 员 投 身 于 其 中 。 网 上 的 一 句 流行 语 颇 耐 人 寻味 : “人 生 苦 短 ， 我 用 Python”。 

在 国外 ，“Python 热 ” 正 在 逐步 升温 ， 涉 及 方方面面 的 领域 ， 在 国内 ， 越 来 越 多 的 大 
学 已 将 Python 列 入 本 科 生 的 必修 课程 或 选修 课程 ， 越 来 越 多 的 IT 企业 将 开发 语言 瞄 向 了 
Python。 可 以 预见 的 是 ， 国 内 的 “Python 热 ” 即 将 掀起 ， 本 书 的 出 版 迎合 了 这 一 趋势 。 

本 书 的 内 容 组 织 说 明 如 下 。 
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为 了 拓展 应 用 范围 ， 充 分 利用 现 有 资源 ， 对 于 Python 程序 员 而 言 ， 熟 练 运用 第 三 方 扩 
展 库 是 非常 重要 的 。 使 用 成 熟 的 扩展 库 ， 可 以 帮助 我 们 快速 地 实现 业务 逻辑 ， 达 到 事 半 功 
倍 的 效果 。 但 是 ， 第 三 方 扩展 库 的 理解 和 运用 ， 无 疑 要 建立 在 对 Python 基础 知识 和 基本 数 
据 结构 熟练 掌握 的 基础 上 。 因 此 ， 本 书 兼顾 “基础 ”与 “应 用 ”两 个 方面 ， 前 6 章 把 重点 
放 在 基础 上 ， 通 过 大 量 的 经 典 例题 ， 讲 解 Python 语言 的 核心 内 容 ; 后 6 章 则 把 重点 放 在 应 
用 上 ， 通 过 大 量 的 案例 ， 介 绍 Python 在 实际 开发 中 的 应 用 。 关 于 不 同 应 用 领域 的 第 三 方 扩 
展 库 ， 读 者 可 以 参考 附录 B， 并 结合 自己 的 专业 领域 查阅 相关 文档 。 

本 书 共 分 12 章 ， 主 要 内 容 组 织 如 下 。 

第 1 章 : Python 程序 设计 入 门 。 介 绍 什 么 是 Python， 学 习 Python 的 原因 ，Python 的 
发 展 历史 ， 多 种 平台 下 Python 环境 的 搭建 ， 使 用 集成 开发 环境 IDLE 来 帮助 学 习 Python， 
Python 常用 的 开发 工具 ， 最 后 给 出 本 书 的 第 一 个 Python 程序 。 

第 2 章 : Python 语言 基础 。 讲 解 Python 的 语法 和 句法 ，Python 的 数据 类 型 ，Python 
的 常量 与 变量 ，Python 的 运算 符 与 优先 级 ，Python 的 数值 类 型 ，Python 的 字符 串 类 型 ， 
Python 的 高 级 数据 类 型 (列表 、 元 组 、 字 典 、 集 合 )， 最 后 介绍 正则 表达 式 及 其 应 用 。 

第 3 章 : Python 流程 控制 。 讲 解 if 语句 和 for 语句 的 基本 格式 、 执 行规 则 、 嵌 套用 
法 ，range0 函 数 在 循环 中 的 使 用 方法 ，while 语句 的 基本 格式 、 执 行规 则 、 嵌 套用 法 ， 最 后 
介绍 break、continue、pass 等 关键 字 在 循环 中 的 使 用 方法 。 

第 4 章 : 函数 模块 。 讲 解 Python 代码 编写 规范 和 风格 ， 函 数 的 定义 与 调用 ， 函 数 参数 
的 传递 ，Python 变量 作用 域 ， 函 数 与 递归 ， 人 迭代 器 与 生成 器 ，Python 自 定义 模块 ， 输 入 输 
出 语句 的 基本 格式 及 执行 规则 ， 匿 名 函数 的 定义 与 使 用 。 

第 5 章 : 文件 与 异常 处 理 。 介 绍 文件 和 文件 对 象 ， 讲 解 基 于 os 模块 的 文件 操作 方法 ， 
基于 shutil 模块 的 文件 操作 方法 ， 文 本 文件 、CSV 文件 、Excel 文件 的 基本 操作 ，HTML、 
XML 文档 的 基本 操作 ， 最 后 介绍 Python 的 异常 处 理 机 制 及 Python 程序 的 调试 方法 。 

第 6 章 : 面向 对 象 编程 。 介 绍 面 向 对 象 技 术 ， 讲 解 类 与 对 象 的 定义 和 使 用 ， 类 的 属性 
与 方法 ， 类 的 作用 域 与 命名 空间 ， 类 的 单 继承 和 多 继承 ， 最 后 以 数 个 典型 实例 讲解 面向 对 
象 程序 设计 的 应 用 。 

第 7 章 : 数据 库 编 程 。 讲 解数 据 库 技术 基础 ，SQLite 和 MySQL 数据 库 的 数据 类 型 、 
基本 操作 ， 使 用 Python 操作 SQLite 和 MySQL 数据 库 的 方法 。 

第 8 章 : Web 开发 。 讲 解 Web 应 用 的 工作 方式 ，MVC 设计 模式 ，CGI 通用 网 关 接 
口 ， 使 用 模板 快速 生成 Web 页 面 。 

第 9 章 : 使 用 Python 进行 数据 分 析 。 讲 解 使 用 Python 进行 数据 挖掘 的 原因 ， 介 绍 
NumpPy 库 、SciPy 库 、Matplotlib 库 和 Pandas 库 ， 最 后 通过 数理 统计 中 的 数据 离散 度 分 析 
和 数据 挖掘 中 的 离 群 点 分 析 等 典型 案例 ， 介 绍 Python 在 数据 可 视 化 方面 的 应 用 。 

第 10 章 : GUI 编程 和 用 户 界 面 。 讲 解 GUI 界面 的 概念 ，Tkinter 模块 及 其 各 种 组 件 ， 
网 格 布局 管理 器 ， 最 后 介绍 GUI 编程 。 

第 11 章 : 多 进程 与 多 线程 。 介 绍 多 进程 与 多 线程 的 概念 ， 讲 解 多 进程 与 多 线程 的 区 
别 ， 进 程 间 通 信 技 术 ， 进 程 池 ， 最 后 介绍 thread 锁 。 

第 12 章 : 网 络 编程 。 讲 解 计算 机 网 络 基 础 知识 ，Socket 通信 技术 ，urllib 库 及 其 使 
用 ， 端 口 扫描 器 ， 最 后 以 一 个 简单 的 网 络 爬 虫 为 例 ， 对 前 几 章 的 知识 进行 综合 应 用 。 
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本 书 最 大 的 特点 是 内 容 紧凑 、 案 例 丰 富 、 学 以 致 用 ;程序 输出 原 滋 原 味 ， 既 有 正确 
输出 的 结果 ， 又 有 错误 输出 的 提示 ， 让 读者 既 能 从 “ 正 ” 的 方面 学 到 经 验 ， 又 能 从 “ 负 ” 
的 方面 吸取 教训 ， 使 经 验 与 教训 兼 而 得 之 。 全 书 总 体内 容 按照 先 基础 、 后 应 用 的 顺序 安 
排 。 前 6 章 为 基础 篇 ， 其 内 容 循序 渐进 ， 后 6 章 为 应 用 篇 ， 其 内 容 自 成 体系 ; 每 个 知识 点 
按照 先 讲解 知识 、 后 给 出 案例 的 顺序 编写 ， 每 个 软件 都 配 有 安装 过 程 截图 ， 每 道 例题 都 配 
有 运行 结果 截图 ， 一 目 了 然 。 

本 书 作者 具有 近 30 年 的 程序 设计 教学 经 验 ， 讲 授 过 多 门 编程 语言 课程 ， 并 编写 过 大 
量 的 应 用 程序 ， 青 年 时 期 曾 参加 过 市 级 讲课 大 赛 并 取得 优异 成 绩 ， 特 别 是 在 美国 访 学 期 
间 ， 用 Python 语言 开发 过 较 大 规模 的 软件 。 在 内 容 的 组 织 和 安排 上 ， 本 书 结合 了 作者 多 年 
教学 与 科研 中 积累 的 经 验 ， 并 巧妙 地 将 其 灶 合 到 相应 的 章节 中 。 

本 书 以 目前 流行 的 Python 3 为 基础 ， 适 当 兼 顾 Python 2.x， 既 讲解 Python 的 基础 知 
识 ， 又 适当 介绍 Python 在 各 个 方面 的 应 用 ， 因 而 ， 可 以 满足 不 同 层 次 读者 的 需要 。 

本 书 可 以 作为 高 等 院 校 计算 机 或 非 计算 机 专业 程序 设计 语言 公共 课 或 选修 课 教 材 ， 基 
础 教学 建议 选取 前 6 章 内 容 ， 推 荐 36 学 时 ; “基础 + 应 用 ”教学 建议 按 “6+n” 方 式 选 取 
教学 内 容 ， 后 面 6 章 可 根据 专业 需要 择 其 一 二 ， 或 全 部 选用 ， 推 荐 42~64 学 时 。 建 议 采 用 
边 讲 边 练 的 教学 模式 。 本 书 可 以 作为 具有 一 定 Python 基础 的 读者 进一步 学 习 的 资料 ， 可 供 
参加 各 类 计算 机 考试 的 人 员 学 习 和 参考 ， 也 可 以 作为 从 事 数据 分 析 、 网 络 运 维 、 数 据 库 开 
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Python 程序 设计 入 门 


mm Python 程序 设计 实用 教程 


本 章 要 点 


(1) Python 概述 。 

(2) 什么 是 Python? 

(3) 为 什么 学 Python? 

(4) Python 的 发 展 。 

(5) Windows 下 Python 环境 的 搭建 。 
(6) Linux 下 Python 环境 的 搭建 。 
(7) 使 用 IDLE 来 帮助 学 习 Python。 
(8) Python 常用 的 开发 工具 。 

(9) 第 一 个 Python 程序 。 

学 习 目 标 

(1) 了 解 Python 语言 。 

(2) 理解 学 习 Python 语言 的 目的 。 
(3) 了 解 Python 语言 的 发 展 。 

(4) 熟悉 常用 平台 下 的 Python 开发 环境 及 其 搭建 。 
(5) 掌握 IDLE 的 使 用 方法 。 

(6) 了 解 其 他 的 常用 开发 工具 。 


本 章 向 读者 引入 在 国内 方兴未艾 的 一 门 高 级 程序 设计 语言 一 Python。 常用 的 编程 语 
言 达 数 十 种 之 多 ， 其 功能 各 有 千秋 ， 应 用 领域 也 大 相 径 庭 。Python 之 所 以 能 够 从 众多 的 高 
级 语言 中 脱颖而出 ， 是 因为 Python 是 一 种 代表 简单 主义 思想 的 语言 ， 但 集 功 能 广泛 与 强大 
于 一 身 。 同 样 的 功能 ， 只 用 很 少 的 代码 就 可 以 实现 ， 编 写 的 程序 清晰 易 懂 ， 优 雅美 观 。 用 
“高 效 开 发 + 简单 易学 ”来 形容 Python 是 恰如其分 的 。 


1.1 Python 概述 


Python 是 一 种 简单 易学 、 功 能 强大 的 编程 语言 ， 它 继承 了 传统 编译 语言 的 强大 性 和 通 
用 性 ， 具 有 高 层次 的 数据 结构 ， 支 持 面向 对 象 的 编程 方法 。 

Python 优雅 的 语法 、 动 态 的 类 型 ， 连 同 它 天 然 的 解释 性 ， 使 其 成 为 在 大 多 数 平台 下 进 
行 许多 领域 快速 应 用 开发 的 理想 语言 。 


1.1.1 什么 是 Python 


Python 是 一 门 跨 平台 的 、 开 源 的 、 免 费 的 、 解 释 型 高 级 动态 编程 语言 ， 是 由 荷兰 人 
Guido van Rossum 在 1989 年 始 创 的 ， 其 名 字 来 源 于 一 个 喜剧 。Python 的 第 一 个 公开 发 行 
版 是 在 1991 年 初 发 布 的 ， 历 经 20 余年 的 发 展 ， 目 前 最 高 版 本 为 3.6。 根 据 TIOBE 的 最 新 
排名 ，Python 已 超越 C#， 与 Java、C、C++ 一 起 ， 成 为 全 球 前 四 大 最 流行 的 语言 。 

也 许 Guido van Rossum 最 初 并 没有 想到 今天 Python 会 在 各 种 行业 中 获得 如 此 广泛 的 
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使 用 。 著 名 的 自由 软件 作者 Eric Raymond 在 “如 何 成 为 一 名 黑客 ”一 文中 ， 将 Python 列 
为 黑客 应 当 学 习 的 四 种 编程 语言 之 一 ， 并 建议 人 们 从 Python 开始 学 习 编 程 。 这 的 确 是 一 个 
非常 中 肯 的 建议 ， 对 于 那些 从 未 学 过 编程 的 人 ， 或 者 对 非 计算 机 专业 的 编程 学 习 者 而 言 ， 
Python 不 失 为 最 好 的 选择 之 一 。 欧 美的 很 多 大 学 (如 MIT、Stanford 等 ) 都 以 Python 作为 入 
门 语言 ， 之 后 再 学 习 C/C++， 甚 至 很 多 非 计算 机 专业 的 学 生 也 开设 此 课 。 相 信 在 不 久 的 将 
来 ， 国 内 高 校 将 兴起 一 股 “Python 热 ”。 

有 些 人 喜欢 用 “胶水 语言 ”来 形容 Python， 是 因为 它 可 以 很 轻松 地 把 许多 其 他 语言 
写 的 模块 结合 在 一 起 。Python 具有 丰富 和 强大 的 基本 类 库 ， 能 够 把 用 其 他 语言 制作 的 各 种 
模块 (尤其 是 C/C++) 很 轻松 地 联结 在 一 起 。 常 见 的 一 种 应 用 情形 是 ， 使 用 Python 快速 生成 
程序 的 原型 (有 时 甚至 是 程序 的 最 终 界面 )， 然 后 对 其 中 有 特别 要 求 的 部 分 ， 用 更 合适 的 语 
言 改写 ， 比 如 3D 游戏 中 的 图 形 泻 染 模块 ， 性 能 要 求 非常 高 ， 就 可 以 用 C/C++ 重 写 ， 而 后 
封装 为 Python 可 以 调用 的 扩展 类 库 。 

很 多 初学 Java 的 人 都 会 被 Java 的 CLASSPATH 搞 得 蜡 头 转向 ， 花 上 大 半天 才 搞 清楚 
原来 是 CLASSPATH 搞 错 了 ， 以 至 于 连 自己 的 “Hello World!” 程 序 都 无 法 运行 。 而 用 
Python， 就 不 会 出 现 此 类 问题 ， 因 为 Python 是 一 种 解释 型 语言 ， 同 时 ， 也 是 一 种 脚本 语 
言 ， 写 好 代码 即 可 直接 运行 ， 省 去 了 编译 、 链 接 的 一 系列 麻烦 ， 对 于 需要 多 动手 实践 的 初 
学 者 而 言 ， 减 少 了 很 多 出 错 的 机 会 。 不 仅 如 此 ，Python 还 支持 交互 的 操作 方式 ， 如 果 只 是 
运行 一 段 简单 的 小 程序 ， 连 编辑 器 都 可 以 省 咯 ， 直 接 输 入 即 可 运行 。 

谈 及 “解释 型 ”和 “脚本 语言 ”， 人 们 常常 会 有 一 种 担心 : 解释 型 语言 通常 很 慢 。 

的 确 ， 从 运行 速度 来 讲 ， 解 释 型 语言 通常 会 慢 一 些 ， 但 Python 的 速度 却 比 人 们 想象 的 
快 很 多 。 虽 然 Python 是 一 种 解释 型 语言 ， 但 实际 上 也 可 以 编译 (就 像 编译 Java 程序 一 样 )， 
即 把 Python 程序 编译 为 一 种 特殊 的 ByteCode。 程 序 运行 时 ， 执 行 的 实际 上 是 ByteCode， 
省 去 了 对 程序 文本 的 分 析 解 释 ， 速 度 自然 得 到 了 显著 的 提升 。 在 用 Java 编程 时 ， 人 们 往往 
崇尚 一 种 Pure Java 方式 ， 除 了 虚拟 机 外 ， 一 切 代 码 都 用 Java 编写 ， 无 论 是 基本 的 数据 结 
构 还 是 图 形 用 户 界 面 ， 而 Pure Java 的 Swing 却 成 为 无 数 Java 应 用 开发 者 的 愤 梦 。 

Python 与 之 不 同 ， 它 崇尚 的 是 实用 ， 它 的 整体 环境 是 用 C 编写 的 ， 其 中 的 很 多 基本 功 
能 和 扩展 模块 均 用 C/C++ 编写 ,执行 这 一 部 分 代码 时 ， 其 速度 就 是 C 的 速度 。 用 Python 
编写 的 普通 桌面 应 用 程序 ， 其 启动 、 运 行 的 速度 与 用 C 书写 的 程序 相差 无 几 。 除 此 之 外 ， 
通过 一 些 第 三 方 软件 包 ， 用 Python 编写 的 源 代码 还 可 以 以 类 似 于 JIT 的 方式 运行 。 此 举 可 
大 大 提高 Python 代码 的 运行 速度 ， 针 对 不 同类 型 的 代码 ， 运 行 速度 将 有 2~100 倍 的 提升 。 

Python 是 一 种 结构 清晰 的 编程 语言 ， 使 用 缩 进 的 方式 来 表示 程序 的 典 套 关系 ， 可 谓 是 
一 种 创举 。 此 举 把 过 去 软 性 的 编程 风格 升级 为 硬性 的 语法 规定 ， 再 也 不 需要 在 不 同 的 风格 
之 间 进 行 选择 。 与 Perl 语言 不 同 ，Python 中 没有 各 种 隐 星 的 缩写 ， 也 不 需要 强 记 各 种 符号 
的 含义 。 用 Python 书写 的 程序 很 容易 读 懂 ， 这 是 不 少 人 的 共识 。 虽 然 Python 是 一 种 面向 
对 象 的 编程 语言 ， 但 它 的 面向 对 象 却 不 像 C++ 那样 强调 概念 ， 而 是 更 注重 实用 。 说 到 底 ， 
Python 不 是 为 了 体现 对 概念 的 完整 支持 而 把 语言 搞 得 很 复杂 ， 而 是 用 最 简单 的 方法 ， 让 编 
程 者 能 够 享受 到 面向 对 象 带 来 的 好 处 ， 这 正 是 Python 能 够 吸引 众多 支持 者 的 原因 之 一 。 

Python 是 一 种 功能 丰富 的 语言 ， 它 拥有 一 个 强大 的 基本 类 库 ， 同 时 拥有 数量 众多 的 第 
三 方 扩展 库 ， 这 使 得 Python 程序 员 无 须 去 鲜 莫 Java 的 JDK。Python 为 程序 员 提 供 的 基本 
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功能 十 分 丰富 ， 使 得 人 们 写 程序 时 无 需 一 切 从 底层 做 起 。 

C 语言 用 来 编写 操作 系统 等 贴近 硬件 的 系统 软件 ， 所 以 ，C 语言 适合 开发 那些 追求 运 
行 速度 、 充 分 发 挥 硬 件 性 能 的 程序 ， 而 Python 是 用 来 编写 应 用 程序 的 高 级 编程 语言 。 许 多 
大 型 网 站 就 是 用 Python 开发 的 ， 例 如 YouTube、Instagram， 还 有 国内 的 豆 办 等 。 很 多 大 型 
的 组 织 机构 ， 包 括 Google、Yahoo 等 ， 甚 至 NASA( 美 国航 空 航天 局 )， 都 大 量 地 使 用 
Python。 除 此 之 外 ， 还 有 搜狐 、 人 金山、 腾讯、 盛大、 网易、 百度 、 阿 里 、 淘 宝 、 土 豆 、 新 
浪 、 果 壳 等 公司 ， 都 在 使 用 Python 完成 各 种 各 样 的 任务 。 

Guido van Rossum 给 Python 的 定位 是 “优雅 、 明 确 、 简 单 ”， 所 以 Python 程序 看 上 
去 总 是 简单 易 懂 。 初 学 者 学 Python， 不 但 入 门 容易 ， 而 且 将 来 深入 下 去 ， 可 以 编写 那些 非 
常 非常 复杂 的 程序 。 

总 地 来 说 ，Python 的 哲学 就 是 简单 优雅 ， 尽 量 写 容易 看 明白 的 代码 和 少 的 代码 。 


1.1.2 为 什么 学 Python 


之 所 以 越 来 越 多 的 人 选择 学 习 Python， 是 因为 Python 有 着 与 众 不 同 的 特性 。 

(1) 易 用 性 与 高 速度 的 完美 结合 。 

在 为 数 众多 的 高 级 语言 中 ， 在 易 用 性 和 速度 上 结合 得 最 完美 的 非 Python 莫 属 。 通 过 形 
失 一 点 点 经 常 可 以 忽略 不 计 的 运行 速度 而 获得 更 高 的 编程 效率 ， 这 是 众多 的 编程 者 选择 
Python 的 原因 。 

(2) 自动 的 垃圾 回收 机 制 。 

Python 的 自动 垃圾 回收 机 制 是 高 级 编程 语言 的 一 种 基本 特性 ， 用 支持 这 一 功能 的 语言 
编程 ， 程 序 员 通 常 无 须 关 心 内 存 泄 漏 问题 ， 而 用 C/C++ 书写 程序 时 ， 这 却 是 最 重要 的 需要 
认真 考虑 而 又 很 容易 出 错 的 问题 之 一 。 

(3) 内 建 的 优异 数据 结构 。 

数据 结构 是 程序 的 重要 组 成 部 分 。 在 用 C 编程 时 ， 对 于 链表 、 树 、 图 这 些 数据 结构 ， 
需要 用 指针 仔细 表达 ， 而 这 些 问题 在 Python 中 简单 了 很 多 。 在 Python 中 ， 最 基本 的 数据 
结构 是 列表 、 元 组 和 字典 ， 用 它们 表达 各 种 常见 的 数据 结构 可 谓 轻而易举 。 由 于 不 再 需要 
定义 指针 、 分 配 内 存 ， 编 程 也 简单 了 许多 。 

(4) 简易 的 CORBA 绑 定 。 

公用 对 象 请 求 代理 体系 结构 (Common Object Request Broker Architecture，CORBA) 是 
一 种 高 级 的 软件 体系 结构 ， 它 是 与 语言 无 关 、 与 平台 无 关 的 。 

C++、Java 等 语言 都 有 CORBA 绑 定 ， 但 与 它们 相 比 ，Python 的 CORBA 绑 定 却 容易 
了 很 多 ， 因 为 在 程序 员 看 来 ， 一 个 CORBA 的 类 和 Python 的 类 用 起 来 以 及 实现 起 来 并 没有 
什么 差别 。 没 有 复杂 体系 结构 的 困扰 ， 用 Python 编写 CORBA 程序 也 变 得 容易 了 。 

(5) 成 熟 的 跨 平 台 技术 。 

随 着 Linux 的 不 断 成 熟 ， 越 来 越 多 的 人 转 到 Linux 平台 下 工作 ， 软 件 的 开发 者 自然 就 
希望 自己 编写 的 软件 可 以 在 所 有 平台 下 运行 。Java 的 “一 次 编写 处 处 运行 ”口号 曾 使 它 成 
为 跨 平 台 开 发 工具 的 典范 ， 但 其 运行 速度 却 不 被 人 们 看 好 。 
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Python 不 仅 支持 各 种 Linux/Unix 系统 ， 还 支持 Windows， 甚 至 在 Palm 上 都 可 以 运行 
Python 程序 。Python 不 仅 支持 老 一 些 的 TK， 还 支持 新 的 GTK+、QT 以 及 wxWidget， 而 
这 些 都 可 以 在 多 个 平台 下 工作 。 通 过 它们 ， 程 序 员 就 可 以 编写 出 漂亮 的 跨 平台 图 形 用 户 界 
(Graphical User Interface，GUD 程 序 。 

(6) 高 可 扩展 性 与 “乘坐 快车 ”。 

如 果 希 望 一 段 代 码 可 以 很 快 地 执行 ， 或 者 不 希望 公开 一 个 算法 ， 则 可 以 使 用 C/C++ 编 
写 这 段 程序 ， 然 后 在 Python 中 调用 ， 从 而 实现 对 Python 程序 的 扩展 。 换 言 之 ， 程 序 员 可 
以 用 C/C++ 为 Python 编写 各 种 各 样 的 模块 ， 这 不 仅 可 以 让 程序 员 以 Python 的 方式 使 用 系 
统 的 各 种 服务 和 用 C/C++ 编 写 的 优秀 函数 库 与 类 库 ， 还 可 以 大 幅度 提高 Python 程序 的 运行 
速度 。 用 C/C++ 编写 Python 的 模块 并 不 复杂 ， 而 且 为 了 简化 这 一 工作 ， 人 们 还 制作 了 不 少 
工具 ， 用 来 协助 这 一 工作 。 正 因 如 此 ， 现 在 各 种 常用 的 函数 库 和 类 库 都 有 Python 语言 的 绑 
定 ， 用 Python 可 以 做 到 的 事情 越 来 越 多 了 。 

Python 从 一 开始 就 特别 关注 可 扩展 性 。Python 可 以 在 多 个 层次 上 扩展 。 从 高 层 上 ， 可 
以 直接 引入 .py 文件 ， 在 底层 则 可 以 引用 C 语言 的 库 。Python 程序 员 可 以 快速 地 使 用 
Python 写 .py 文件 作为 扩展 模块 。 但 当 运 行 速度 作为 重要 的 考虑 因素 时 ，Python 程序 员 可 
以 深入 底层 ， 写 C 程序 ， 编 译 为 .so 文件 后 引入 到 Python 中 使 用 ， 就 如 同人 们 乘坐 快车 一 
样 。Python 恰似 使 用 钢 来 构建 房子 ， 规 定好 大 的 框架 之 后 ， 程 序 员 可 以 在 此 框架 下 相当 自 
由 地 扩展 或 更 改 。 

(7) 隐 茂 细节， 凸显 逻 辑 。 

Python 将 许多 机 器 层面 上 的 细节 隐藏 ， 交 给 编译 器 处 理 ， 并 凸显 出 逻辑 层面 的 编程 思 
考 。Python 程序 员 可 以 花 更 多 的 时 间 用 于 思考 程序 的 逻辑 ， 而 不 是 具体 的 实现 细节 。 这 一 
特征 吸引 了 广大 的 程序 员 。 

Python 有 如 此 众多 的 优点 ， 读 者 是 否 会 觉得 Python 是 一 把 万 能 钥匙 呢 ? 答案 自然 是 否 
定 的 。 这 是 因为 ，Python 虽然 功能 强大 ， 但 它 却 不 是 万 能 的 。 不 同 的 语言 有 不 同 的 应 用 范 
围 ， 想 找 一 把 “万 能 钥匙 ”是 不 太 可 能 的 。C 和 汇编 语言 适合 编写 系统 软件 ， 如 果 用 它们 
来 编写 企业 应 用 程序 ， 恐 怕 很 难得 心 应 手 。 因 此 ， 聪 明 的 程序 员 总 是 选用 合适 的 工具 去 开 
发 软件 。 如 果 要 编写 操作 系统 或 驱动 程序 ，Python 很 显然 是 做 不 到 的 。 要 写 软件 ， 没 有 哪 
个 工具 是 万 能 的 ， 现 在 之 所 以 有 那么 多 的 编程 语言 ， 就 是 因为 不 同 的 语言 适合 做 不 同 的 事 
情 。 因 此 ， 选 择 适 合 自己 的 语言 才 是 最 重要 的 。 

常言 道 : “好 钢 要 用 在 刀刃 上 。” 要 想 用 有 限 的 时 间 完 成 尽量 多 的 任务 ， 就 要 把 各 种 
无 关 的 问题 抛弃 ， 而 Python 恰恰 提供 了 这 种 方法 ， 这 也 是 我 们 要 学 习 Python 的 原因 。 


1.1.3 “Python 的 发 展 


1989 年 ， 为 了 打发 圣诞 节 假 期 ，Guido 开始 写 Python 语言 的 编译 器 。Python 这 个 名 
字 ， 来自 Guido 所 执 爱 的 电视 剧 Monty Python's Flying Circus。 他 希望 这 个 新 的 称 作 
Python 的 语言 能 符合 他 的 理想 : 创造 一 种 介 于 C 和 Shell 之 间 、 功 能 全 面 、 易 学 易 用 、 可 
拓展 的 语言 。 

1991 年 ， 第 一 个 Python 编译 器 诞生 ， 它 是 用 C 语言 实现 的 ， 并 能 够 调用 C 语言 的 库 
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文件 。Python 从 一 开始 就 具有 了 类 、 函 数 、 异 常 处 理 ， 并 且 拥 有 包含 表 和 字典 在 内 的 核心 
数据 结构 ， 以 及 以 模块 为 基础 的 拓展 系统 。 

1994 年 1 月 ，Python 1.0 推出 ， 其 中 增加 了 lambda、map、filter 和 reduce。 

1999 年 ，Python 的 Web 框架 之 祖 一 一 Zope 1 发 布 。 

2000 年 10 月 16 日 ，Python 2.0 问世 ， 加 入 了 内 存 回收 机 制 ， 构 成 了 现在 Python 语言 
框架 的 基础 。 

2004 年 11 月 30 日 ，Python 2.4 版 出 现 ， 同 年， 目前 最 流行 的 Web 框架 Django 诞生 。 

2006 年 和 2008 年 先后 推出 的 2.5 和 2.6 为 过 渡 版 本 (2008 年 已 推出 3.0 版 本 )，2010 年 
推出 的 2.7 版 为 2x 的 最 后 一 版 。 

2014 年 11 月 ，Python 2.7 将 在 2020 年 停止 支持 的 消息 被 发 布 ， 并 且 不 会 再 发 布 2.8 
版 本 ， 同 时 建议 用 户 尽 可 能 地 迁移 到 3.4+。 

Python 最 初 发 布 时 ， 在 设计 上 有 一 些 缺 陷 ， 比 如 Unicode 标准 晚 于 Python 出 现 ， 所 以 
一 直 以 来 ， 对 Unicode 的 支持 并 不 完全 ， 而 ASCII 码 支持 的 字符 很 有 限 。 早 期 版 本 对 中 文 
的 支持 不 好 ，Python 3 相对 于 Python 早期 的 版 本 是 一 个 较 大 的 升级 ，Python 3 在 设计 的 时 
候 没有 考虑 向 下 兼容 ， 所 以 很 多 早期 版 本 的 Python 程序 无 法 在 Python 3 下 运行 。 为 了 照顾 
早期 的 版 本 ， 推 出 了 过 渡 版 本 2.6， 该 版 基本 上 使 用 了 Python 2.x 的 语法 和 库 ， 同 时 考虑 了 
向 Python 3.0 的 迁移 ， 人 允许 使 用 部 分 Python 3.0 的 语法 与 函数 。2010 年 继续 推出 了 兼容 版 
本 2.7， 大 量 Python 3 的 特性 被 反 向 迁移 到 了 Python 2.7。2.7 比 2.6 进步 非常 多 ， 同 时 拥有 
大 量 的 Python 3 中 的 特性 和 库 ， 并 且 照 顾 了 原 有 的 Python 开发 人 群 。 

前 面 刚刚 提 到 ，Python 2.7 是 2.x 系列 的 最 后 一 个 版 本 ， 已 经 停止 开发 ， 不 再 增加 新 的 
功能 ， 而 且 将 于 2020 年 终止 支持 ， 这 意味 着 所 有 最 新 的 标准 库 更 新 改进 ， 只 会 在 3.x 版 本 
里 出 现 。Guido 决定 清理 Python 2.x， 并 且 不 再 兼容 旧版 本 。 

2.0 版 到 3.0 版 最 大 的 一 个 改变 ， 就 是 使 用 Unicode 作为 默认 编码 。Python 2.x 中 直接 
写 中 文 会 报错 ，Python 3 中 可 以 直接 写 中 文 了 。 从 开源 项 目 来 看 ， 支 持 Python 3 的 比例 已 
经 显著 提高 ， 知 名 的 项 目 一 般 都 支持 Python 2.7 和 Python 3+。 

Python 3 比 Python 2 更 规范 、 统 一 ， 去 掉 了 不 必要 的 关键 字 。Python 3.x 还 在 持续 改 
进 ， 截 至 本 书 定稿 ，Python 的 最 高 版 本 是 2017 年 7 月 17 日 推出 的 3.6.2 版 。 我 们 推荐 大 
家 使 用 Python 3.x。 











1.2 Python 开发 环境 的 搭建 


Python 可 在 多 种 平台 下 运行 ， 但 考虑 到 目前 应 用 较 多 的 是 Windows 平台 和 Linux 了 
台 ， 故 本 节 分 别 介绍 这 两 种 平台 下 Python 开发 环境 的 搭建 。 


1.2.1 Windows 下 Python 开发 环境 的 搭建 


(1) 下 载 Python 安装 包 。 
首先 登录 Python 官方 网 站 http://www.python.org/download/， 点 击 Download 后 ， 选 择 
适合 自己 版 本 的 安装 包 ， 并 下 载 之 。 


ie 


六 


























第 1 章 Python 程序 设计 入 门 上 


(2) 安装 Python。 

双击 下 载 的 安装 包 ， 一 路 单 击 Next， 最 后 单 击 Finish。 

(3) 配置 环境 变量 。 

Python 安装 完毕 后 ， 还 需要 把 Python 的 安装 目录 添加 到 系统 的 PATH 环境 变量 中 。 

(4) 测试 。 

在 DOS 命令 提示 窗口 中 输入 “python”， 若 显示 图 1-1 所 示 的 界面 ， 则 说 明 Python 
已 经 安装 成 功 。 








画 CWwindows\system3Demd exe - python ex 








图 1-1 Python 安装 成 功 的 显示 界面 


(5) 演示 Python 命令 。 

按照 很 多 资料 介绍 的 ， 输 入 的 第 一 个 命令 是 “print ‘Hello world!"”， 如 图 1-2 所 示 。 

结果 显示 “SyntaxError”( 句 法 错误 )。 为 什么 会 出 错 呢 ? 原因 在 于 ， 很 多 资料 都 是 以 
Python 2.x 为 背景 介绍 的 ， 而 现在 我 们 安装 的 是 3.x 版 本 ，3.x 要 求 采用 的 写法 是 print 
(Hello World1*)， 即 把 print 视 为 一 个 函数 ， 而 不 是 命令 (考虑 到 习惯 ， 本 书 仍 称 其 为 print 
命令 )， 因 而 需要 使 用 括号 ， 并 把 字符 串 放 在 引号 中 ( 单 引 号 、 双 引号 均 可 ， 但 首尾 必须 相 
同 )。 改 正 后 的 运行 结果 如 图 1-3 所 示 。 


画 cwindows\system32vmdexe - python = 





windows\system32\cmd.exe - Python 


print( “Hello. world! ') 
ello, world! 






[= 避让 





print ‘Hell 
File “Katd 





图 1-2 想 要 显示 “Hello world!” 图 1-3 命令 行 上 显示 “Hello world!” 


(6) 集成 开发 环境 的 使 用 。 

经 过 以 上 测试 可 知 ，Python 环境 已 安装 完毕 ， 但 如 何 开发 软件 呢 ， 难 道 用 这 种 命令 行 
方式 开发 ? 当然 不 是 ， 因 为 有 众多 的 集成 开发 环境 (Integration Development Environment， 
IDE) 可 供 使 用 。 

在 Windows 下 安装 Python 的 同时 ， 也 默认 安装 了 其 自 带 的 集成 开发 环境 IDLE， 其 启 
动 方法 是 : 开始 一 所 有 程序 一 Python 3.4 一 IDLE， 启 动 后 的 界面 如 图 1-4 所 示 。 
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图 1-4 Python 的 集成 开发 环境 IDLE 田 面 
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当然 ，Python 的 集成 开发 环境 远 不 止 IDLE， 常 用 的 还 有 如 下 几 种 。 

(1) Eclipse: 大 名 易 易 的 Eclipse， 此 处 不 予 介绍 。 

(2) Komodo Edit: 一 个 免费 的 、 开 源 的 、 专 业 的 Python IDE， 其 特征 是 非 菜单 的 操作 

(3) Vim: 一 个 简洁 、 高 效 的 工具 ， 也 适合 做 Python 开发 。 

(4) SublimeText 也 是 适合 Python 开发 的 IDE 工具 ，SublimeText 虽然 仅仅 是 一 个 编辑 
器 ， 但 是 它 有 丰富 的 插件 ， 使 得 对 Python 开发 的 支持 非常 到 位 。 

(5) Pycharm: 一 个 跨 平 台 的 Python 开发 工具 ， 是 JetBrains 公司 的 产品 。 其 特征 包 
括 : 代码 自动 完成 、 集 成 的 Python 调试 器 、 括 号 自动 匹配 、 代 码 折 县 。Pycharm 支持 
Windows、MacOS 以 及 Linux 等 系统 ， 而 且 可 以 远程 开发 、 调 试 、 运 行程 序 。 尽 管 这 个 
IDE 功能 确实 很 强大 ， 也 很 好 用 ， 但 使 用 一 段 时 间 后 要 付费 。 


1.2.2 Linux 下 Python 开发 环境 的 搭建 


前 一 小 节 介绍 的 是 Windows 平台 下 Python IDLE 安装 和 调试 的 过 程 。 通 常 的 Linux 系 
统 ， 如 Ubuntu、CentOS 等 ， 都 已 经 默认 地 随 系统 安装 好 Python 程序 了 ， 只 不 过 在 Linux 
类 系统 中 ， 这 个 IDLE 被 称 为 Python 解释 器 ， 它 是 从 终端 模拟 器 中 输入 “python” 这 个 命 
令 启动 的 。Python 编程 的 一 切 工作 都 是 从 这 个 IDLE 编辑 器 开始 的 。 在 入 门 后 ， 可 以 选择 
更 多 自己 喜欢 的 Python 编辑 器 ， 如 专业 级 Python 编辑 器 WingIDE。 

遗憾 的 是 ， 早 期 版 本 Linux 操作 系统 中 内 置 的 Python 版 本 多 是 2.x 的 ， 想 在 3.x 下 开 
发 软件 ， 必 须 安装 3.x 版 的 Python。 现 以 Ubuntu( 一 个 以 桌面 应 用 为 主 的 Linux 操作 系统 ) 
为 例 ， 简 要 介绍 一 下 Linux 下 Python 3 开发 环境 的 搭建 过 程 。 

(1) 安装 Python 3。 

Ubuntu 自身 是 安装 Python 2 的 ， 例 如 ， 在 Ubuntu 16.04 中 安装 的 就 是 Python 2.7。 但 
我 们 需要 在 Python 3 环境 下 进行 软件 开发 ， 所 以 必须 安装 Python 3。 不 过 由 于 Ubuntu 很 多 
底层 采用 了 Python 2， 所 以 安装 Python 3 时 不 能 卸载 Python 2。 首 先 执行 以 下 各 行 命令 : 

sudo cp /usr/bin/python /usr/bin/python bak 


sudo rm /usr/bin/python 
sudo ln -s /usr/bin/python3.5 /usr/bin/python 


然后 输入 “python”， 检 查 版 本 是 否 正确 (版 本 应 该 为 Python 3.5)。 

(2) 安装 Sublime Text 3。 

俗话 说 : “ 工 欲 善 其 事 ， 必 先 利 其 器 。” 在 进行 Python 开发 时 ， 一 定 要 先 选择 一 个 好 
的 编辑 器 。Sublime Text 3(ST3) 是 一 款 轻 量 级 、 跨 平台 的 文本 编辑 器 ， 可 以 安装 在 
Ubuntu、Windows 和 Mac OS X 上 ， 有 一 个 专 有 的 许可 证 ， 但 该 程序 也 可 以 免费 使 用 。 如 
果 想 拥有 更 高 级 的 版 本 ， 可 付费 获取 。 

打开 终端 ， 输 入 下 列 命令 : 

sudo add-apt-repository ppa:webupd8team/sublime-text-3 


sudo apt-get update 
sudo apt-get install sublime-text-installer 
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印 载 sublime text 命令 : 
sudo apt-get remove sublime-text-installer 


这 时 候 会 发 现 桌面 上 并 没有 出 现 Sublime Text 3， 那 应 当 如 何 打 开 它 呢 ? 从 终端 输入 
subl 才能 启动 sublime-text， 启 动 后， 直接 将 它 锁定 到 侧 边 栏 即 可 。 

(3) 配置 Sublime Text 3。 

为 了 使 用 众多 的 插件 来 扩展 Sublime 的 功能 ， 需 要 安装 一 个 称 为 Package Control 的 插 
件 管理 器 一 一 这 个 东西 必须 手动 安装 。 但 是 一 旦 安装 好 ， 就 可 以 使 用 Package Control 来 安 
装 、 移 除 或 者 升级 所 有 的 ST3 插件 了 。 

按 “Ctl+ ~” 组 合 键 打开 控制 台 ， 在 控制 台 里 输入 以 下 代码 : 

import urllib.request,os;pf='Package Control.sublime-package';ipp= 

sublime.installed packages path();urllib.request.install opener (urllipb. 

request .build opener (urllib.request.ProxyHandler ())) ;open (os.path.join 


(ipp, pf), 'wb') .write (urllib.request.urlopen('http://sublime.wbond.net/' 
+pf.replace(' ','$20')).read()) 




















输 完 以 后 ， 按 Enter 键 就 可 以 执行 了 。 

现在 可 以 通过 快捷 键 Cmd+ShifttP 打开 Package Control 来 安装 其 他 的 插件 了 。 输 入 
install 后 ， 就 能 看 见 屏 幕 上 出 现 了 Package Control: Install Package( 如 图 1-5 所 示 )， 按 回 车 
键 ， 然 后 搜索 想 要 的 插件 ， 想 装 哪个 插件 ， 直 接点 击 即 可 。 

因为 我 们 想 要 配置 Python， 所 以 选择 第 一 个 ， 选 择 后 会 出 现 一 个 文本 框 ， 如 图 1-6 所 示 。 





图 1-5 ”插件 的 安装 图 1-6 Python 插件 的 安装 





在 其 中 输入 “Anaconda”( 这 是 Sublime Text 3 中 最 好 的 一 个 Python 插件 )， 然 后 按 
Enter 键 ， 片 刻 后 即 出 现 如 图 1-7 所 示 的 界面 ， 表 明 Anaconda 已 安装 完毕 。 
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图 1-7 Python 插件 的 安装 
1.2.3 使 用 IDLE 来 帮助 学 习 Python 


1. IDLE 的 安装 
1 述 ， 安 装 Python 3 时 ， 默 认 会 得 到 一 个 IDLE( 图 1-4)， 这 是 Python 的 集成 开发 





如 训 
环境 ， 尽 管 简单 ， 但 极为 实用 。 

2. IDLE 的 启动 

前 一 小 节 已 介绍 了 IDLE 的 启动 方法 。IDLE 启动 后 ， 窗 口 标题 栏 显 示 的 是 Python 
3.x.X Shell， 窗 口内 显示 提示 符 “>>>”， 光 标 紧 随 其 后 ， 表 明 已 经 准备 就 绪 ， 可 以 在 光标 
处 输入 代码 了 。Shell 获取 代码 语句 后 会 立即 执行 ， 并 在 屏幕 上 显示 结果 。 

例如 ， 我 们 在 >>> 后 键入 语句 : 


print('This is a command.') 





则 屏幕 显示 : 

This is a command. 

接着 ， 我 们 计算 两 个 变量 相 加 的 值 ， 输 入 : 
a=123 

b=456 

print (a+b) 

屏幕 立即 显示 计算 结果 579。 

上 述 过 程 如 图 1-8 所 示 。 


.0N. 
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总 Python 3.4.3 Shell ele >| 


Fie Edit Shell Debug Options Window Help 
Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit 了 | 














license()" for more information- 





>>> print (a+p) 
579 


>>>| 
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图 1-8 直接 在 Python 集成 编辑 环境 IDLE 下 输入 命令 


上 面 的 例子 表明 ， 我 们 可 以 通过 Shell 在 IDLE 内 部 执行 Python 命令 。 除 此 之 外 ， 
IDLE 还 自 带 编辑 器 、 解 释 器 和 调试 器 ， 其 中 ， 编 辑 器 用 来 编辑 Python 程序 (或 者 脚本 )， 
解释 器 用 来 解释 执行 Python 语句 ， 调 试 器 用 来 调试 Python 脚本 。 下 面 我 们 从 IDLE 的 编 
辑 器 开始 介绍 。 


3. 利用 IDLE 创建 Python 程序 


IDLE 为 开发 人 员 提供 了 很 多 有 用 的 特性 ， 如 自动 缩 进 、 语 法 着 色 显 示 、 代 码 自动 完 
成 以 及 缓存 命令 历史 等 ， 这 些 功 能 可 以 帮助 我 们 高 效 地 编写 程序 。 我 们 通过 一 个 示例 程序 
对 这 些 特性 分 别 加 以 介绍 ， 示 例 程序 的 源 代码 如 下 : 




















# 提 示 用 户 输入 数据 

integerl = input (' 请 输入 第 一 个 整数 :') 
integerl = int (integerl) 

integer2 = input (' 请 输入 第 二 个 整数 :') 
integer2 = int (integer2) 


if integerl>integer2: 

print ('%d > %d' %(integerl,integer2)) 
elses 

print ('%d <= %d' %(integerl,integer2) ) 

下 面 演示 如 何 利用 IDLE 的 编辑 器 来 创建 Python 程序 。 

要 新 建 一 个 文件 ， 首 先 从 File 菜单 中 选择 New File 菜单 命令 ， 这 样 就 可 以 在 出 现 的 窗 
口中 输入 源 程序 了 。 

在 输入 源 程序 的 过 程 中 ， 我 们 会 体验 到 IDLE 的 几 个 非常 方便 的 功能 。 

(1) 自动 缩 进 功能 。 

这 里 介绍 一 下 IDLE 的 自动 缩 进 功能 。 事 实 上 ， 很 少 有 哪 种 语言 能 够 像 Python 这 样 重 
视 缩 进 了 ， 在 其 他 语言 (比如 C) 中 ， 缩 进 对 于 代码 的 编写 来 说 是 “有 了 更 好 ”， 而 不 是 
“没有 不 行 ”， 它 充其量 是 个 人 书写 代码 的 风格 问题 ， 但 是 到 了 Python 这 里 ， 则 把 缩 进 提 
升 到 了 语法 的 高 度 。 换 言 之， 复合 语句 不 是 用 大 括号 f} 之 类 的 符号 表示 ， 而 是 通过 代码 缩 
进来 表示 。 这 样 做 的 好 处 ， 就 是 减少 了 程序 员 的 自由 度 ， 有 利于 统一 风格 ， 使 得 人 们 在 阅 
读 代码 时 更 加 轻松 。 为 此 ，IDLE 提供 了 自动 缩 进 功能 ， 它 能 将 光标 定位 到 下 一 行 的 指定 
位 置 。 当 我 们 键入 与 控制 结构 对 应 的 关键 字 ， 如 站 等 ， 或 者 输入 诸如 def 等 与 函数 定义 对 
应 的 关键 字 时 ， 按 下 Enter 键 后 ，IDLE 就 会 启动 自动 缩 进 功能 。 
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如 图 1-9 所 示 ， 当 站 语句 连同 其 后 的 冒号 输入 完毕 并 按 Enter 键 之 后 ，IDLE 将 自动 进 
行 缩 进 。 一 般 情况 下 ，IDLE 将 代码 缩 进 一 级 ， 即 4 个 空格 。 如 果 想 改变 这 个 默认 的 缩 进 
量 ， 可 以 从 Format 菜单 中 选择 New indent width 命令 进行 修改 。 


总 *Untitled* 一 
File Edit Format Run Options Window Help 
# 提 示 用 户 输入 数据 
integerl = input (" 请 输入 第 一 个 整数 :") 
integerl = int (integt 
integer2 = input (' 请 输入 
integer2 = int(integer2) 
£f integerl>integer2: 
print ('sd > sd' %(integerl,integer2)) 














全 





print ("sd <= sd' §(integerl,integer2)) 
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(2) 语法 着 色 显 示 。 

这 里 介绍 一 下 IDLE 的 语法 着 色 显 示 。 所 谓语 法 着 色 显 示 ， 就 是 使 用 不 同 的 颜色 来 突 
出 显示 代码 中 的 不 同 元 素 ， 关 于 这 一 点 ， 我 们 从 图 1-8 和 图 1-9 所 示 的 界面 中 能 够 看 到 。 
默认 情况 下 ， 关 键 字 显示 为 栖 色 ， 内 建 函数 显示 为 紫色 ， 字 符 串 显示 为 绿色 ， 输 出 的 所 有 
结果 均 显 示 为 蓝 色 。 在 键入 代码 时 ， 会 自动 应 用 这 些 颜 色 突 出 显示 。 如 果 想 改变 这 些 颜 
色 ， 可 以 调整 IDLE 的 首选 项 。 

语法 着 色 显示 的 好 处 在 于 ， 可 以 更 容易 地 区 分 不 同 的 语法 元 素 ， 从 而 提高 了 程序 的 可 
读 性 ;与 此 同时 ， 语 法 着 色 显 示 还 降低 了 出 错 的 可 能 性 。 例 如 ， 如 果 输 入 的 变量 名 显示 为 
橙色 ， 那 就 说 明 该 变量 名 与 Python 的 关键 字 冲 突 ， 此 时 必须 给 变量 重新 命名 。 

(3) 代码 自动 完成 。 

这 里 介绍 一 下 代码 自动 完成 功能 。 代 码 自 动 完成 指 的 是 ， 当 用 户 输入 单词 的 前 几 个 字 
母后 按 Tab 键 时 ，IDLE 会 在 当前 光标 处 弹出 10 个 选项 ， 用 户 可 以 从 中 选择 所 需要 的 单词 
或 单词 组 合 (函数 名 、 变 量 名 等 )， 如 果 找 不 到 ， 还 可 以 用 上 下 箭头 键 进行 查找 。 例 如 ， 输 
入 pr 后 按 Tab 键 ， 弹 出 10 个 提示 选项 ，print 处 于 首位 ， 按 空格 键 即 可 将 其 输入 。 

程序 创建 好 之 后 ， 从 File 菜单 中 选择 Save 命令 保存 该 程序 。 若 是 新 文件 ， 则 系统 将 
弹出 Save as 对 话 框 ， 提 示 输 入 文件 名 和 保存 位 置 。 保 存 之 前 ， 窗 口 标题 栏 的 名 称 是 
“*Untitled*”; 保存 之 后 ， 指 定 的 文件 名 会 自动 蔡 代 “*Untitled* ”。 如 果 文 件 改动 后 尚 
未 存盘 ， 则 标题 栏 的 文件 名 前 后 会 出 现 星 号 ， 旨 在 提醒 操作 人 员 。 


4. IDLE 常用 的 编辑 功能 


现在 我 们 介绍 一 下 编辑 Python 程序 时 常用 的 IDLE 选项 。 我 们 按照 不 同 的 菜单 分 别 列 
出 ， 供 初学 者 参考 。 

(1) 对 于 Edit 菜单 ， 除 了 上 面 介绍 的 几 个 之 外 ， 常 用 的 选项 如 下 。 

Undo: 撤销 上 一 次 的 修改 。 

Redo: 重复 上 一 次 的 修改 。 

Cut: 将 所 选 文本 剪 切 至 剪贴 板 。 

Copy: 将 所 选 文本 复制 到 剪贴 板 。 
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Paste: 将 剪贴 板 的 文本 粘贴 到 光标 所 在 位 置 。 

Find: 在 窗口 中 查找 单词 或 模式 。 

Find in files: 在 指定 的 文件 中 查找 单词 或 模式 。 

Replace: 蔡 换 单词 或 模式 。 

Goto line: 将 光标 定位 到 指定 行 首部 。 

(2) 对 于 Format 菜单 ， 常 用 的 选项 如 下 。 

Indent region: 使 所 选 内 容 右 移 一 级 ， 即 增加 缩 进 量 。 

Dedent region: 使 所 选 内 容 左 移 一 级 ， 即 减少 缩 进 量 。 

Comment out region: 将 所 选 内 容 变 成 注释 。 

Uncomment region: 去 除 所 选 内 容 每 行 前 面 的 注释 符 。 

New indent width: 重新 设 定制 表 位 缩 进 宽 度 ， 范 围 为 2~-16， 当 宽度 为 2 时 ， 相 当 于 1 
个 空格 。 

Expand word: 代码 自动 完成 。 

Toggle tabs: 打开 或 关闭 制 表 位 。 


5. 在 IDLE 中 运行 Python 程序 


欲 使 用 IDLE 执行 程序 ， 可 从 Run 菜单 中 选择 Run Module 命令 ， 该 命令 的 功能 是 执 
行当 前 文件 。 对 于 前 面 的 示例 程序 ， 执 行情 况 如 图 1-10 所 示 。 


丸 Python 3.4.3 Shell 


Eile Edit Shell Debug Options Window Help 

Python 3.4.3 (v3.4.3:9b73flc3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit | 
(Intel)] on win32 

Type "copyright", "credits" or "license()" for more information. 

>>> 一 -一 


>>> 
请 输入 第 一 个 整数 :23 
请 输入 第 二 个 整数 :34 
23 <= 34 

>>> 











scok4| 








图 1-10 示例 程序 的 运行 结果 

6. IDLE 调试 器 的 使 用 

软件 开发 过 程 中 出 错 是 在 所 难免 的 ， 有 语法 方面 的 错误 ， 也 有 逻辑 方面 的 错误 。 对 于 
语法 错误 ，Python 解释 器 能 轻而易举 地 检测 出 来 ， 此 时 它 会 停止 程序 运行 ， 并 显示 出 错 信 
息 ; 而 对 于 逻辑 错误 ， 解 释 器 就 著 长 莫 及 了 ， 此 时 程序 会 一 直 往 下 执行 ， 但 得 到 的 结果 却 
是 不 正确 的 。 有 鉴于 此 ， 我 们 常常 需要 调试 程序 。 

最 简单 的 调试 方法 莫 过 于 直接 显示 程序 的 中 间 数 据 。 例 如 ， 可 以 在 程序 的 某 些 关键 位 
置 插入 print 语句 ， 用 以 显示 某 些 中 间 变 量 的 值 ， 从 而 判断 出 错 与 否 。 但 这 个 办 法 比较 麻 
烦 ， 因 为 开发 人 员 必 须 在 所 有 可 疑 的 地 方 都 插入 print 语句 ， 待 程序 调试 完 后 ， 还 必须 删除 
这 些 语句 ， 很 繁琐 。 

Python 中 自 带 了 一 个 调试 模块 pdb， 专 门 用 于 调试 程序 ， 本 书 5.8 节 中 将 详细 介绍 ， 
本 章 仅 介 绍 IDLE 自身 提供 的 调试 功能 。 

IDLE 提供 了 一 个 调试 器 ， 为 我 们 查找 逻辑 错误 带 来 了 诸多 方便 。 利 用 调试 器 ， 可 以 


3. 
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分 析 被 调 程序 的 数据 ， 并 监视 程序 的 执行 流程 。 调 试 器 的 功能 很 强 ， 包 括 暂 停 程序 执行 、 
检查 和 修改 变量 、 调 用 方法 而 不 更 改 程序 代码 等 。 下 面 简要 介绍 一 下 IDLE 调试 器 的 使 用 
方法 。 

在 Python Shell 窗口 中 ， 选 择 Debug 菜单 中 的 Debugger 命令 ， 便 可 启动 IDLE 的 交互 
式 调试 器 。 此 时 ，IDLE 将 打开 Debug Control 窗口 ， 并 在 Python Shell 窗口 中 输出 [DEBUG 
ON]， 后 跟 提 示 符 “>>>”。 这 样 一 来 ， 我 们 就 可 以 像 平时 那样 使 用 这 个 Python Shell 窗口 
了 ， 所 不 同 的 是 ， 现 在 输入 的 任何 命令 都 必须 是 在 调试 器 下 允许 使 用 的 命令 。 还 可 以 在 
Debug Control 窗口 中 查看 局 部 变量 和 全 局 变量 等 有 关内 容 。 要 退出 调试 器 ， 可 以 再 次 单 击 
Debug 菜单 中 的 Debugger 命令 ， 这 时 IDLE 会 关闭 Debug Control 窗口 ， 并 在 Python Shell 
窗口 中 输出 [DEBUG OFF]。 


7. IDLE 的 命令 历史 功能 


在 DOS/Unix 等 以 命令 行 方式 操作 的 操作 系统 中 ， 用 户 使 用 上 下 箭头 键 可 以 方便 地 调 
出 以 前 用 过 的 各 种 命令 ， 颇 为 方便 ， 这 一 功能 称 为 “命令 历史 ”功能 。 命 令 历史 可 以 记录 
会 话 期 间 在 命令 行 中 执行 过 的 所 有 命令 。 在 IDLE 提示 符 下 ， 按 AlttP 组 合 键 可 以 找 回 这 
些 命令 。 每 按 一 次 ，IDLE 就 会 从 最 近 的 命令 开始 检索 命令 历史 ， 并 按 命令 使 用 的 顺序 逐 
个 显示 。 按 AlttN 组 合 键 ， 则 可 以 反 向 遍历 各 个 命令 ， 即 从 最 初 的 命令 开始 遍历 。 


8. IDLE 小 结 


IDLE 是 Python 安装 包 自 带 的 一 个 集成 开发 环境 ， 虽 相对 简单 ， 但 对 Python 的 初学 者 
非常 适用 。 本 小 节 通 过 一 个 示例 程序 详细 介绍 了 IDLE 在 Python 编程 中 的 使 用 方法 ， 希 望 
读者 能 够 熟练 使 有 用。 另外， 除非 特殊 指明 ， 本 书 所 用 的 集成 开发 环境 均 指 IDLE。 


1.2.4 ”Python 常用 的 开发 工具 


这 里 所 说 的 开发 工具 ， 实 际 上 指 的 就 是 集成 开发 环境 IDE。 一 个 优秀 的 IDE， 最 重要 
的 要 求 就 是 在 完成 一 般 文 本 编辑 的 基础 上 ， 能 够 提供 针对 特定 语言 的 各 种 快捷 编辑 功能 ， 
让 程序 员 尽 可 能 快捷 、 和 舒适 、 清 晰 地 浏览 、 输 入 、 修 改 代 码 。 对 于 一 个 现代 IDE 来 说 ， 语 
法 着 色 、 错 误 提 示 、 代 码 自 动 完成 、 代 码 折 又 、 代 码 块 定位 、 重 构 ， 及 与 调试 器 、 版 本 控 
制 系统 (Version Control System，VCS) 的 集成 等 ， 都 是 重要 的 功能 。 以 插件 、 扩 展 系统 为 代 
表 的 可 定制 框架 ， 已 成 为 现代 IDE 的 另 一 个 流行 趋势 。 

但 IDE 并 非 功能 越 多 越 好 ， 这 是 因为 ， 更 多 的 功能 往往 意味 着 更 大 的 复杂 度 和 更 大 的 
开销 ， 这 不 但 会 分 散 程序 员 的 精力 ， 而 且 还 可 能 带 来 更 多 的 错误 。 一 般 来 讲 ， 满 足 基 本 功 
能 需要 、 符 合 自己 使 用 习惯 的 IDE， 就 是 最 好 的 IDE。 程 序 员 的 逻辑 永远 是 : 用 最 合适 的 
工具 做 最 合适 的 事情 。 

正 因 如 此 ， 比 起 大 而 全 的 IDE， 以 单纯 的 文本 编辑 器 结合 独立 的 调试 器 、 交 互 式 命令 
行 等 外 部 小 工具 ， 也 是 另 一 种 开发 方式 。 由 于 Python 本 身 的 简洁 性 ， 在 书写 小 的 代码 片段 
以 及 通过 示例 代码 学 习 时 ， 这 种 方式 尤其 适合 。 

这 里 简单 介绍 Python 程序 员 中 最 流行 的 几 款 IDE。 
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(1) 内 置 IDE。Python 的 各 个 常见 发 行 版 均 有 内 置 的 IDE， 虽 然 它们 的 功能 一 般 不 够 
强大 、 完 整 ， 但 简便 易 得 ， 对 于 初学 者 来 说 ， 它 们 也 是 上 手 的 最 好 选择 ， 可 以 让 用 户 更 专 
注 于 语言 本 身 ， 而 不 会 因 IDE 的 繁琐 和 复杂 而 分 散 精力 。 

(2) IDLE。IDLE 是 Python 的 官方 标准 开发 环境 ， 简 单 而 小 巧 ， 但 具备 了 Python 应 
用 开发 的 几乎 所 有 功能 ， 包 括 了 交互 式 命令 行 、 编 辑 器 、 调 试 器 等 基本 组 件 ， 足 以 满足 大 
多 数 简单 应 用 的 要 求 。IDLE 是 用 纯 Python 基于 Tkinter 编写 的 ， 最 初 的 作者 正 是 Python 
之 父 Guido van Rossum 本 人 。 

(3) PythonWin 。PythonWin 是 Python Win32 Extensions( 半 官方 性 质 的 Python for 
Win32 增强 包 ) 的 一 部 分 ， 也 包含 在 ActivePython 的 Windows 发 行 版 中 ， 该 版 本 只 针对 
Win32 平台 。 

总 体 来 说 ，PythonWin 是 一 个 增强 版 的 IDLE， 其 优势 体现 在 易 用 性 方面 (如 同 
Windows 本 身 的 风格 )。 除 了 易 用 性 和 稳定 性 之 外 ，( 简 单 的 ) 代 码 完 成 和 更 强 的 调试 器 功能 
相对 于 IDLE 都 是 明显 优势 。 

(4) MacPython IDE。MacPythonIDE 是 Python 的 Mac OS 发 行 版 内 置 的 IDE， 可 视 为 
PythonWin 的 Mac 对 应 版 本 ， 由 Guido 的 兄长 Just van Rossum 编写 。 

(5) Emacs 和 Vim。Emacs 和 Vim 号 称 是 全 球 最 强大 的 两 个 文本 编辑 器 ， 对 于 许多 程 
序 员 来 说 ， 它 们 是 万 能 IDE 的 最 佳 选择 。 比 起 同类 的 通用 文本 编辑 器 (如 UltraEdit)， 
Emacs 和 Vim 由 于 扩展 功能 十 分 强大 ， 可 以 有 针对 性 地 搭建 出 更 为 完整 便利 的 IDE。 

虽然 掌握 二 者 之 后 可 谓 终身 受益 ， 但 其 学 习 曲 线 都 比较 陡峭 。 由 于 历史 原因 ， 它 们 的 
设计 理念 都 是 基于 纯 ASCII 字符 环境 ，GUI 相对 来 说 不 是 支持 的 重点 ， 只 有 大 量 使 用 快捷 
键 才能 带 来 最 大 的 便利 。 对 于 初学 者 来 说 ， 相 对 而 言 Vim 更 简洁 一 些 , 但 Emacs 的 GUI 
与 一 般 编辑 器 的 习惯 更 接近 些 。 

(6) Eclipse + PyDev。Eclipse 是 新 一 代 优秀 的 泛 用 型 I DE， 虽然 它 是 基于 Java 技术 开 
发 的 ， 但 出 色 的 架构 使 其 具有 不 逊 于 Emacs 和 Vim 的 可 扩展 性 ， 目 前 已 经 成 为 许多 程序 
员 最 爱 的 一 把 “瑞士 军刀 ”。 

PyDev 是 Eclipse 上 的 Python 开发 插件 中 最 为 成 熟 、 最 为 完善 的 一 个 ， 而 且 还 在 持续 
的 活跃 开发 之 中 。 除 了 Eclipse 平台 提供 的 基本 功能 之 外 ，PyDev 的 自动 代码 完成 、 语 法 查 
错 、 调 试 器 、 重 构 等 功能 都 做 得 相当 出 色 ， 可 以 说 是 开源 产品 中 最 为 强大 的 一 个 ， 许 多 贴 
心 的 小 功能 也 很 符合 用 户 的 编辑 习惯 ， 使 用 起 来 得 心 应 手 。 

但 有 其 利 必 有 其 次， 无 论 是 Eclipse 还 是 PyDev， 在 速度 和 资源 占用 方面 都 是 致命 的 ， 
在 低 配 置 机 器 上 运行 起 来 比较 吃力 。 

(7) UliPad。UliPad 是 国内 知名 的 Python 开发 工具 ， 是 由 PythonCN 社区 核心 成 员 
Limodou 开发 的 IDE。 因 为 UliPad 是 基于 wxPython 开发 的 ， 所 以 安装 UliPad 之 前 需要 先 
安装 wxPython。 

(8) SPE(Stani"s Python Editor)。SPE 是 很 有 特色 的 一 个 轻 量 级 的 Python IDE， 功 能 很 
全 面 而 不 失 小 巧 轻便 ， 特 别 适合 书写 小 的 脚本 。 

即时 生成 代码 的 UML 类 图 是 其 独树一帜 的 功能 。 除 此 之 外 ，SPE 还 特别 注重 与 外 部 
工具 的 集成 。 例 如 ， 集 成 了 wxGlade 作为 所 见 即 所 得 的 GUI 开发 环境 ， 集 成 了 Winpdb 作 
为 调试 器 ， 甚 至 还 能 与 3D 建 模 工 具 Blender 集成 。 
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SPE 没有 管理 Project 的 概念 ， 当 开发 多 文件 、 多 目录 组 成 的 项 目 时 会 感到 不 便 。 此 
外 ， 界 面 设计 相对 来 讲 不 够 细致 ， 也 算是 瑕 竟 。 

(9) WingIDE。WingIDE 是 Wingware 公司 开发 的 商业 化 产品 ， 总 体 来 说 ， 是 目前 最 
为 强大 、 最 为 专业 的 Python IDE。 其 最 大 的 缺点 和 PyDev 一 样 ， 就 是 资源 占用 比较 多 ， 导 
致 速度 慢 。 

(10) 其 他 IDE。 除 了 上 述 几 款 IDE 之 外 ， 还 有 很 多 常用 的 IDE， 此 处 不 再 一 一 列举 ， 
比较 著名 的 有 Pycharm、Eric3、Komodo、Textmate、Scribes、Intype、PyScripter 等 。 


1.2.5 “Hello World!” 一 一 第 一 个 Python 程序 


在 1.2.1 小 节 中 介绍 Python 开发 环境 的 搭建 时 ， 我 们 演示 了 在 DOS 命令 提示 符 窗口 中 
直接 输出 字符 串 “Hello World!” 的 例子 。 尽 管 单一 的 语句 能 够 在 屏幕 上 输出 所 需 的 内 容 ， 
但 一 般 来 讲 ， 用 户 可 能 更 需要 编写 Python 程序 来 实现 特定 的 业务 逻辑 ， 同 时 也 方便 代码 的 
不 断 完 善 和 重复 利用 ， 毕 竟 直 接 使 用 交互 模式 不 是 很 方便 。 此 时 可 以 使 用 1.2.3 小 节 中 介 
绍 的 方法 创建 程序 文件 ， 输 入 程序 并 保存 为 文件 (务必 保证 扩展 名 为 py) 后 ， 执 行 Run 一 
Run Module 命令 运行 ， 程 序 运行 结果 将 直接 显示 在 IDLE 交互 界面 上 。 除 此 之 外 ， 也 可 以 
在 资源 管理 器 中 双击 扩展 名 为 py 的 Python 程序 文件 来 运行 ， 在 某 些 情况 下 ， 还 可 能 需要 
在 DOS 命令 提示 符 环境 下 运行 Python 程序 文件 。 在 “开始 ”菜单 的 “附件 ”中 单 击 “ 命 
令 提 示 符 ”， 然 后 执行 Python 程序 。 例 如 ， 假 设 有 程序 hw.py， 其 内 容 如 下 : 

def main() : 

Print('Hello World!') 




























main() 

在 IDLE 环境 中 运行 该 程序 后 ， 结 果 如 图 1-11 所 示 。 在 DOS 命令 提示 符 环 境 下 运行 
该 程序 后 ， 结 果 如 图 1-12 所 示 。 这 里 展示 了 运行 Python 程序 的 两 种 方法 ， 虽 然 第 二 种 方 
法 看 上 去 更 加 简单 ， 但 是 我 们 推荐 使 用 第 一 种 方法 来 运行 Python 程序 。 

于 Python 343 shell Ex | | 夯 cwindowssysem3 el 
File Edit Shell Debug Qptions Window Help 
Python 3.4.3 (v3.4.3:9b73flc3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit 之 他 
{Intel)] in32 
Ee OP 9 全 的 
i cat | 所 册 
图 1-11 在 IDLE 中 运行 程序 图 1-12 在 命令 提示 符 下 运行 程序 
EE 
本 章 小 结 


Python 是 一 种 代表 简单 主义 思想 的 语言 ， 但 是 它 功能 强大 ， 应 用 广泛 。 我 们 在 使 用 
Python 编程 时 ， 经 常会 感觉 到 它 的 方便 、 快 捷 。 在 本 章 中 ， 我 们 对 Python 进行 了 简单 的 介 
绍 ， 了 解 了 什么 是 Python， 为 什么 要 学 习 Python; 简单 讲述 了 Python 的 发 展 历史 和 流行 
版 本 ， 详 解 了 搭建 Python 环境 的 基本 方法 ， 重 点 介绍 了 IDLE 开发 工具 的 使 用 方法 ， 以 及 
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用 其 学 习 Python 的 优势 所 在 。 除 了 IDLE 之 外 ， 本 章 还 简单 地 介绍 了 数 种 常用 的 Python 
开发 工具 ， 供 读者 自行 选用 。 

















习 题 
1. 填空 是 


(1) Python 是 一 种 ( ) 语 言 ， 写 好 代码 即 可 直接 运行 ， 省 去 了 ( 认 攻 ) 
等 一 系列 麻烦 ， 这 对 于 需要 多 动手 实践 的 初学 者 而 言 ， 减 少 了 很 多 出 错 的 机 会 。 

(2) Python 支持 ( ) 的 操作 方式 ， 如 果 只 是 运行 一 段 简单 的 小 程序 ， 连 编辑 器 都 
可 以 省 略 ， 直 接 输入 即 可 运行 。 

(3) Python 是 一 种 结构 清晰 的 编程 语言 ， 使 用 ( ) 的 方式 来 表示 程序 的 谋 套 关系 ， 
将 过 去 软 性 的 编程 风格 升级 为 硬性 的 语法 规定 。 

(4) Python 3.x 将 print 视 为 一 个 ( ) 而 不 是 命令 。 

(5) 欲 使 用 IDLE 执行 程序 ， 可 从 Run 菜单 中 选择 ( ) 命 令 ， 该 命令 的 功能 是 执 
行当 前 文件 。 


2. 选择 题 
(1) 哪 一 个 不 是 Python 的 特点 ? ( ) 

A. 简洁 性 B. 可 扩展 性 C. 解释 性 D. 万 能 性 
(2) 第 一 个 Python 编译 器 是 哪 一 年 问世 的 ?( ) 

A. 1989 年 B. 1991 年 C. 1999 年 D. 2001 年 
(3) 哪 一 个 不 是 Python 语言 的 基本 结构 ? ( ) 

A. 链表 B. 元 组 C. 字典 D. 集合 
(4) Python 从 哪个 版 本 开始 全 面 支持 Unicode? ( ) 

A.1.0 B. 2.0 2 D30 
(5) 下 面 哪个 不 是 Python 的 与 众 不 同 特性 ?( ) 

A. 易 用 性 与 高 速度 的 完美 结合 B. 成 熟 的 跨 平 台 技术 

C. 具有 丰富 和 强大 的 基本 类 库 D. 简易 的 CORBA 绑 定 
3. 问答 题 


(1) 什么 是 Python? 请 简单 叙述 一 下 。 
(2) 在 输入 源 程序 的 过 程 中 ，IDLE 有 哪 几 个 很 方便 的 功能 ? 
(3) Python 常用 的 开发 工具 有 哪些 ? 
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本 章 要 点 

(1) Python 的 语法 和 句法 。 

(2) Python 的 数据 类 型 。 

(3) Python 的 常量 与 变量 。 

(4) Python 的 运算 符 与 优先 级 。 

(5) Python 的 数值 类 型 。 

(6) Python 的 字符 串 类 型 。 

(7) Python 的 高 级 数据 类 型 (列表 、 元 组 、 字 典 、 集 合 )。 
(8) 正则 表达 式 。 

学 习 目 标 

(1) 了 解 Python 的 语法 和 和 句法。 

(2) 理解 Python 的 数据 类 型 。 

(3) 掌握 Python 的 常量 与 变量 。 

(4) 掌握 Python 的 数值 、 字 符 串 、 列 表 、 元 组 、 字 典 、 集 合 。 
(5) 掌握 正则 表达 式 的 概念 及 其 应 用 。 


本 章 将 以 较 大 的 篇 幅 介 绍 Python 语言 最 基础 的 内 容 ， 包 括 Python 语法 、 基 本 数据 类 
型 、 常 量变 量 、 运 算 符 与 优先 级 、 高 级 数据 类 型 ， 最 后 介绍 正则 表达 式 的 概念 及 其 应 用 。 


2.1 基础 Python 语法 


2.1.1 标识 符 


在 编程 语言 中 ， 标 识 符 就 是 程序 员 自 己 规定 的 具有 特定 含义 的 词 ， 比 如 类 名 称 、 属 性 
名 、 变 量 名 、 函 数 名 等 。 一 般 语 言 规定 ， 标 识 符 由 字母 或 下 划 线 开头 ， 后 面 可 以 跟 字 母 、 
数字 、 下 划 线 。 

Python 标识 符 的 命名 规则 如 下 。 

(1) 标识 符 长 度 无 限制 。 

(2) 标识 符 不 能 与 关键 字 ( 见 附录 A) 同 名 。 

(3) 字母 大 小 写 敏 感 。 

(4) 在 2.x 版 本 的 Python 中， 标识 符 的 命名 规则 与 一 般 语言 的 规定 一 样 ， 但 在 3.x 的 
Python 中 进行 了 扩展 ， 标 识 符 的 引导 字符 可 以 是 字母 、 下 划 线 以 及 大 多 数 非 英文 语言 的 字 
母 ， 只 要 是 Unicode 编码 的 字母 均 可 ， 后 续 字 符 可 以 是 上 述 任 意 字 符 ， 也 可 以 是 数字 。 

虽然 Python 对 标识 符 命名 的 限制 很 少 ， 但 使 用 时 ， 仍 需要 注意 以 下 约定 。 

(1) 不 要 使 用 Python 预定 义 的 某 些 标识 符 ， 因 此 要 避免 使 用 诸如 NotImplemented 等 
名 字 ， 这 些 在 未 来 有 可 能 被 Python 的 新 版 本 使 用 。 

(2) 不 要 使 用 Python 内 建 函 数 名 或 内 置 数据 类 型 或 异常 名 作为 标识 符 的 名 字 。 

(3) 不 要 在 名 字 的 开头 和 结尾 都 使 用 下 划 线 ， 因 为 Python 中 大 量 地 采用 这 种 名 字 定 义 
各 种 特殊 的 方法 和 变量 。 
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2.1.2 ”Python 语法 和 句法 


Python 语句 中 有 一 些 基本 规则 和 特殊 字符 。 

(1) 井 号 则 表示 其 后 的 字符 为 Python 语句 的 注释 。 

(2) 换行 Go) 是 标准 的 行 分 隔 符 ( 通 常 一 个 语句 占 一 行 )。 

(3) 反 和 斜 线 人 继续 上 一 行 。 

(4) 分 号 (;) 将 两 条 语句 放 在 一 行 中 。 

(5) 冒号 () 将 复合 语句 的 头 和 体 分 开 。 

(6) 代码 块 (语句 块 ) 用 缩 进 的 方式 体现 。 

(7) 用 不 同 的 缩 进深 度 分 隔 不 同 的 代码 块 。 

(8) Python 文件 以 模块 的 形式 组 织 。 

1. 注释 (#) 

尽管 Python 是 可 读 性 最 好 的 语言 之 一 ， 但 这 并 不 意味 着 代码 中 的 注释 可 以 不 要 。 
Python 的 注释 语句 以 # 字 符 开始 ， 注 释 可 以 在 一 行 的 任何 地 方 开 始 ， 解 释 器 将 会 忽略 该 行 # 
之 后 的 所 有 内 容 。 

2. 续 行 (\) 

一 般 来 讲 ，Python 的 相 邻 语句 使 用 换行 ( 回 车 ) 分 隔 ， 亦 即 一 行 一 条 语句 。 如 果 一 行 语 
名 过 长 ， 可 以 使 用 续 行 符 Q) 分 解 为 多 行 ， 例 如 : 

print ("This line is toooooooooo \ 

long") 

关于 续 行 符 有 两 种 例外 情况 。 

(1) 一 个 语句 不 使 用 反 斜 线 也 可 以 跨行 书写 。 

在 使 用 闭合 操作 符 时 ， 单 一 语句 也 可 以 跨 多 行 。 例 如 ， 在 含有 小 括号 、 中 括号 、 花 括 
号 时 ， 可 以 多 行书 写 : 

print ("This is a multiline", 

"example") 

但 须 注意 ， 这 时 的 缩 进 (即使 是 自动 的 缩 进 ) 将 失去 语法 上 的 作用 。 

(2) 三 引号 内 包含 的 字符 串 也 可 以 跨行 书写 。 例 如 : 

print('''hi there, this is a long message for you 

that goes over multiple lines!''') 

如 果 要 在 使 用 反 斜 线 换行 和 使 用 括号 元 素 换行 之 间 做 一 个 选择 的 话 ， 我 们 推荐 使 用 后 
者 ， 因 为 这 样 可 读 性 会 更 好 。 


3. 多 个 语句 构成 代码 组 (:) 


缩 进 位 置 相 同 的 一 组 语句 形成 一 个 语句 块 ， 亦 称 代码 块 或 代码 组 。 像 让 for、while、 
def 和 class 之 类 的 复合 语句 ， 首 行 均 以 关键 字 开始 ， 并 以 冒号 (:) 结 束 ， 该 行 之 后 的 一 行 或 
多 行 代码 就 构成 了 代码 组 ， 即 语句 块 。 





2. 


am 区 python 程序 设计 实用 教程 


4. 代码 组 以 不 同 的 缩 进 分 隔 
Python 使 用 缩 进来 分 隔 代码 组 。 代 码 的 层次 关系 是 通过 相同 深度 的 空格 或 制 表 符 缩 进 
来 体现 的 ， 同 一 代码 组 内 的 代码 行 左边 必须 严格 对 齐 。 换 言 之 ， 一 个 代码 组 内 的 各 行 代 
码 ， 左 边 必须 有 数目 相同 的 空格 或 数目 相同 的 制 表 符 ， 而 且 不 能 以 一 个 制 表 符 替代 多 个 空 
格 ! 如 果 不 严格 遵守 这 一 规则 ， 同 一 组 的 代码 就 可 能 被 视 为 另 一 个 组 ， 轻 则 导致 逻辑 错 
误 ， 重 则 导致 语法 错误 。 
还 注意 : 对 初次 使 用 空白 字符 作为 代码 块 分 界 的 人 来 说 ， 首 先 遇 到 的 问题 是 : 缩 进 几 
空格 或 制 表 符 才 算 合适 ? 理论 上 讲 是 没有 限制 的 ， 但 我 们 推荐 使 用 4 个 空 
格 。 需 要 说 明 一 点 ， 不 同 的 文本 编辑 器 中 制 表 符 代表 的 空白 宽度 不 一 样 ， 如 
果 所 写 的 代码 要 跨 平 台 应 用 ， 或 者 将 来 要 被 不 同 的 编辑 器 来 读 写 ， 那 么 建议 
不 要 使 用 制 表 符 。 
随 着 缩 进 深度 的 增加 ， 代 码 块 的 层次 也 在 逐步 加 深 ， 未 缩 进 的 代码 块 处 于 最 高 层次 ， 
称 作 脚本 的 main 部 分 。 
采用 缩 进 对 齐 方式 来 组 织 代码 ， 不 但 代码 风格 优雅 ， 而 且 其 可 读 性 也 大 大 增强 。 不 仅 
如 此 ， 这 种 方法 还 有 效 地 避免 了 “悬挂 else”(dangling-else) 问 题 ， 同 时 也 避免 了 未 写 大 括 
号 时 的 单一 子 句 问题 。 试 想 ， 如 果 C 语言 的 计 语句 后 漏 写 大 括号 ， 而 后 面 却 跟着 两 个 缩 
进 的 语句 ， 结 果 会 如 何 呢 ? 毫 无 疑问 ， 无 论 条 件 表 达 式 是 否 成 立 ， 第 二 个 语句 总 会 被 执 
行 。 这 种 问题 很 难 调试 ， 不 知 困惑 了 多 少 程序 员 。 


5. 同一 行书 写 多 个 语句 (;) 

Python 允许 将 多 个 语句 写 在 同一 行 上 ， 语 句 之 间 用 分 号 隔 开 ， 而 这 些 语 句 也 不 能 在 这 
行 开始 一 个 新 的 代码 块 。 例 如 : 

a=10; b=20; print (a+b) 

但 必须 指出 ， 同 一 行 上 书写 多 个 语句 ， 会 使 代码 的 可 读 性 大 大 降低 。Python 虽然 允许 
这 样 做 ， 但 并 不 提倡 这 么 做 。 

6. 模块 

每 个 Python 脚本 文件 均 可 视 为 一 个 模块 ， 它 以 磁盘 文件 的 形式 存在 。 如 果 一 个 模块 
规模 过 大 ， 包 含 的 功能 太 多 ， 就 应 该 考虑 对 该 模块 进行 拆 分 ， 即 拆 出 一 些 代 码 另 外 组 建 一 
个 或 多 个 模块 。 模 块 里 的 代码 既 可 以 是 一 段 直接 执行 的 脚本 ， 也 可 以 是 一 堆 类 似 库 函 数 的 
代码 ， 从 而 可 以 被 别 的 模块 导入 (imporb 后 调用 。 模 块 可 以 包含 直接 运行 的 代码 块 、 类 定 
义 、 函 数 定义 ， 或 它们 的 组 合 。 
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2.2.1 数据 类 型 


与 C 等 编译 型 语言 不 同 ，Python 中 的 变量 无 须 声明 。 每 个 变量 在 使 用 前 都 必须 赋值 
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变量 赋值 以 后 ， 该 变量 才 会 被 创建 。 


在 Python 中 ， 变 量 就 是 变量 ， 它 没有 类 型 ， 我 们 所 说 的 “类 型 ”是 变量 所 指 的 内 存 
中 对 象 的 类 型 。 

赋值 运算 符 (=) 用 来 给 变量 赋值 。 

赋值 运算 符 左 边 必须 是 一 个 变量 名 ， 右 边 是 存储 在 变量 中 的 值 。 例 如 : 


| >>> counter = 100 i 
|>>> miles = 1000.0  ”# 浮 点 型 变量 
>>> name = "python"” # 字符 串 
>>> print (counter); print (miles); print (name) 
中 100 
1000.0 
python 
>>> | 
Python 允许 同时 为 多 个 变量 赋值 ， 例 如 : 
a=b=€=1 
阁 注意 : 
@ ”以 上 赋值 语句 创建 了 一 个 整 型 对 象 ， 值 为 1， 三 个 变量 被 分 配 到 相同 的 内 存 空间 
上 。 以 下 的 运行 结果 可 以 证 实 这 一 点 : 


>>> a=b=c=1 

>>> print ("a 的 地 址 :",id(a)) 
a 的 地 址 : 1693176272 

>>> print ("b 的 地 址 :", id(b)) 
b 的 地 址 : 1693176272 

>>> print ("c 的 地 址 :",id(c)) 
c 的 地 址 : 1693176272 

>>> | 


@ Python 中 的 一 切 事物 皆 为 对 象 ， 并 且 规定 参数 的 传递 都 是 对 象 的 引用 ， 因 此 ， 对 
象 的 赋值 实际 上 是 对 象 的 引用 。 


也 可 以 为 多 个 对 象 指定 多 个 变量 ， 例 如 : 


arbne = 2 python®, 


以 上 形式 的 赋值 语句 也 称 作 复合 赋值 语句 ， 两 个 整 型 对 象 1 和 2 分 配给 变量 a 和 b， 
字符 串 对 象 "python” 分 配给 变量 c。 

Python 3 中 有 6 种 标准 的 数据 类 型 ， 它 们 是 Number( 数 值 )、String( 字 符 串 )、List( 列 
表 )、Tuple( 元 组 )、Dictionary( 字 典 )、Sets( 集 合 )。 本 节 介 绍 数值 类 型 ， 后 续 各 节 分 别 介绍 
其 余 的 各 种 类 型 。 

Python 3 支持 4 种 数值 类 型 : int( 整 型 )、float( 浮 点 型 )、bool( 布 尔 型 )、complex( 复 数 
型 )。 

在 Python 3 里 ， 只 有 一 种 整数 类 型 int， 表 示 为 长 整 型 ， 而 不 像 Python 2 那样 区 分 标 
准 整 型 与 长 整 型 。 

与 大 多 数 编程 语言 一 样 ， 数 值 类 型 的 赋值 和 计算 都 是 很 直观 的 。 内 建 的 函数 type0 可 
以 用 来 查询 变量 所 指 的 对 象 类 型 。 例 如 : 
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>>> ar b, c, d = 10, 3.5, True, 2+4j 

>>> print (type (a), type(b), type(c), type(d)) 

<class 'int'> <class 'float'> <class 'bool'> <class ‘complex'> 
>>> | 


还 注意 : 在 Python 2 中 没有 布尔 型 ， 它 像 C 语言 那样 ， 用 数字 0 表示 False， 用 1 表示 
True。 在 Python 3 中 ， 把 True 和 False 定义 成 关键 字 了 ， 但 它们 的 值 仍然 是 
和 0， 它们 可 以 和 数字 参与 运算 。 

当 指定 一 个 值 时 ， 就 创建 了 一 个 Number 对 象 : 








同样 ， 这 里 的 varl 和 var2 是 两 个 对 象 引用 。 使 用 del 语句 可 以 删除 对 象 引 用 。del 语 
句 的 语法 是 : 

del varl[,var2[,var3[...,varN]]] 

例如 : 


del var 
del var a, var b 


一 个 变量 可 以 通过 赋值 指向 不 同类 型 的 对 象 。 例 如 : 
>>> a=10 
>>> print (type (a)) 
<class 'int'> 
>>> a="10" 
>>> print (type (a)) 
lags "qtr > 
>>> 


1. 数值 运算 


像 其 他 语言 一 样 ，Python 的 数值 运算 包括 加 、 减 、 乘 、 除 四 则 运算 以 及 取 余 、 乘 方 运 
算 等 。 例 如 : 


>>> 5 + 4 # 加 法 

>>> 4.3 - 2 # 减法 

S53 # 乘法 

>>> 2 / 4 # 除法 ， 得 到 一 个 浮 点 数 
SS /A 所 除法， 得 到 一 个 整数 
Sl # 取 余 


>>> 2 xx 5 # 乘 方 
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逮 注意 : 

@ ”除法 运算 符 “/” 总 是 返回 一 个 浮 点 数 ， 要 返回 整数 应 使 用 “//” 运 算 符 。 

@ 在 混合 运算 时 ，Python 把 整 型 数 转换 成 为 浮 点 数 。 

@。 除 上 述 运算 外 ，Python 的 整数 还 支持 “位 运算 ”， 详 见 表 2-1。 

2. 数值 类 型 实例 

Python 3 支持 的 数值 类 型 实例 如 下 。 

int 型 实例 : 10、100、-786、080、-0490、-0x260、0x69。 

float 型 实例 : 0.0、15.20、-21.9、32.3e+18、-90.、-32.54e100、70.2e-12。 

bool 型 实例 ;True、False。 

Python 还 支持 复数 。 复 数 由 实 部 和 虚 部 构成 ， 可 以 表示 为 a + bj 或 者 complex(a,b)， 
其 中 实 部 a 和 虚 部 b 都 是 浮 点 型 。 

complex 型 实例 : 3.14j、45j、9.322e-36j、.876j、-.6545+0j、3e+26j、4.53e-7j。 


2.2.2 ”常量 与 变量 

几乎 所 有 的 编程 语言 都 有 变量 和 常量 的 概念 ， 它 们 与 数学 上 的 概念 很 相似 。 

1. 变量 

变量 与 数学 函数 中 的 变量 一 样 。 顾 名 思 义 ， 变 量 就 是 其 值 可 以 改变 的 量 ， 只 不 过 在 程 
序 中 变量 不 仅仅 可 以 是 数字 ， 还 可 以 是 字符 串 等 。 变 量 名 的 命名 方式 严格 遵循 上 一 节 提 及 
的 Python 标识 符 命名 规则 ， 即 由 英文 字母 、Unicode 字符 ( 含 汉 字 )、 数 字 、 下 划 线 组 成 ， 
且 不 能 以 数字 开头 。 

下 面 的 例子 通过 赋值 运算 符 把 1 赋值 给 a， 这 个 a 就 是 我 们 创建 的 一 个 变量 : 


>>> a=1 


这 里 我 们 用 一 个 字母 来 表示 变量 ， 通 过 赋值 运算 符 来 给 变量 赋值 。 

Python 是 动态 语言 ， 所 以 我 们 不 需要 像 C 语言 那样 提前 声明 一 个 变量 的 数据 类 型 。C 
语言 使 用 变量 之 前 需要 声明 一 下 。 例 如 : 

int a=1; 

而 Python 直接 使 用 a=1 即 可 。 这 就 是 动态 语言 的 好 处 ， 我 们 无 须 关 心 变量 本 身 的 数 
据 类 型 ，Python 有 自己 的 判断 机 制 。 
逊 注意 : 给 变量 赋值 的 时 候 ，Python 只 会 记 住 最 后 一 次 所 赋 的 值 。 例 如 : 
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>>> a=1 
>>> a=2 
>>> a 

2 

>>> | 


先 给 a 赋值 |， 再 赋值 >， 最 后 输出 a 的 时 候 显示 的 是 最 后 一 次 所 赋 的 值 2。 

2. 常量 

常量 与 变量 相对 应 ， 就 是 程序 运行 过 程 中 其 值 不 可 改变 的 量 。 例 如 ， 

pi=3,.1415926 

这 时 ， 我 们 就 认定 PI 是 个 常量 ， 也 就 是 说 ，PI 始终 代表 3.1415926。 实 际 上 ，Python 
中 并 没有 严格 意义 的 常量 ， 因 为 Python 中 没有 保证 常量 不 会 改变 的 机 制 。 一 般 来 讲 ， 我 们 
使 用 全 部 大 写 的 字母 来 表示 常量 。 尽 管 我 们 称 PI 为 常量 ， 但 仍然 可 以 给 PI 重新 赋值 。 

换言之 ，Python 的 世界 里 本 来 就 没有 常量 ， 编 程 时 主动 不 修改 的 变量 也 就 伪装 成 了 党 
量 。 用 大 写字 母 来 “ 注 明 ” 常 量 ， 只 有 提醒 的 意义 ， 其 实 这 个 值 还 是 可 以 改变 的 。 

在 编程 过 程 中 ， 我 们 可 能 会 用 到 常量 的 概念 ， 所 以 这 里 还 是 要 提 一 下 。 
2.2.3 ”运算 符 与 优先 级 


1. Python 的 运算 符 
Python 的 运算 符 十 分 丰富 ， 表 2-1 简要 列 示 了 Python 的 运算 符 及 其 用 法 。 
表 2-1 Python 运算 符 及 其 用 法 
























































运算 符 名 称 说 明 例 子 
十 加 两 个 对 象 相 加 (对 字符 串 则 是 连接 ) | 3+5 得 到 8。 'a"+'b， 得 到 “ab， 
得 到 一 个 负数 ， 或 是 一 个 数 减 去 另 | -5.2 得 到 一 个 负数 。 50 - 24 得 到 26 
- 减 / 负 号 
一 个 数 
。 两 个 数 相 乘 或 是 返回 一 个 被 重复 若 | 2*3 得 到 6。 "la'*3 得 到 “lalala” 
干 次 的 字符 串 
i 徊 指数 运算 ， 返 回 x 的 y 次 寡 3**4 得 到 81 ( 即 3*3*3*3) 
除 x 除 以 y 4/3 得 到 1.3333333333333333 
内 取 商 数 返回 商 的 整数 部 分 4/3.0 得 到 1.0 
% 取 余 数 返回 除法 的 余数 8%63 得 到 2。 -25.5%2.25 得 到 1.5 
把 一 个 数 的 位 向 左 移 一 定数 目 ( 每 | 2 << 1 得 到 4。 因 为 2 用 二 进 制 表示 
_ 左 移 个 数 在 内 存 中 都 表示 为 位 或 二 进 制 | 时 为 10B， 往 左 移 一 位 变 成 二 进 制 的 
数字 , 即 0 和 1) 100B， 二 进 制 的 100B 用 十 进 制 表示 则 
为 4 


/26N. 


第 2 章 ”Python 放言 东 础 人 











续 表 
运算 符 名 称 说 明 例 子 
11>>1 得 到 5。 因为 11 用 二 进 制 表示 时 
>> 右 移 把 一 个 数 的 位 向 右 移 一 定数 目 为 1011B， 向 右 移动 1 位 后 得 到 101B， 
即 十 进 制 的 5 
位 和 5&3 得 到 1。 
& (Bitwise 数 的 位 和 (101B &11B 得 到 1B) 
AND) 
位 或 513 得 到 7。 
(Bitwise 数 的 位 或 (101B111B 得 到 111B) 
| OR) 
_ 位 汕 转 位 德 转 x 的 位 翻转 是 -(x+1)，~5(101B) 得 到 -6 


-110B. 
比较 运算 符 ， 返 回 x 是 否 小 于 y | 5<3 返回 0( 即 False); 而 3<5 返回 1( 即 
的 结果 。 返 回 1 则 表示 真 ， 返 回 | True)。 也 可 以 任意 连接 比较 运算 符 ，3 
< 小 于 0 则 表示 假 。Python 中 也 可 以 用 | <5<7 返 回 Tme 
特殊 的 变量 True 表示 真 ， 用 False 
表示 假 。 注 意 首 字 母 为 大 写 






































5>3 返回 True。 如 果 两 个 操作 数 都 是 数 
值 ， 它 们 会 先 被 转换 成 相同 的 类 型 后 才 












































> ey 和 开始 计算 。 如 果 x 和 y 类 型 不 同 ， 则 会 
返回 False 

i 小 于 或 等 于 | 返回 x 是 否 小 于 或 等 于 y x=3;y=6;x<=y 返回 Tme 

>= 大 于 或 等 于 | 返回 x 是 否 大 于 或 等 于 y Xx=4;y=3;x>=y 返回 Tme 

一 | 等 于 比较 两 个 对 象 是 否 相等 es 
x= ‘abc’;y= ‘Abc’; x 一 y 返回 False 

二 不 等 于 比较 两 个 对 象 是 否 不 相等 x=2;y=3;x!=y 返回 Trme 

如 果 x 为 None( 空 )、0、False 或 空 | x= Trme; notx 返回 False。 
not 布尔 非 字符 串 ， 则 not x 会 返回 True， 否 | x=False; not x 返回 Trme 




















则 not x 会 返回 False 











Xx 三 False; y = True; x and y 的 结果 会 返回 
如 果 x 为 False，x and y 返回 a 在 这 个 例子 里 ，Python 语言 并 不 
and 布尔 与 False， 否 则 它 会 返回 y 的 计算 什 会 计算 y 的 值 ， 因 为 x 的 值 已 经 是 
False， 所 以 这 个 表达 式 的 值 肯定 是 
False。 这 个 现象 称 为 短路 计算 
如 果 x 为 Tme， 则 返回 Tme， 否 | x = Tme: y = False; x or y 的 结果 会 返 
则 返回 y 的 计算 值 True。 短 路 计算 在 这 里 也 同样 适用 

















EE 











or 布尔 或 
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2. Python 运算 符 的 优先 级 





表 2-2 给 出 Python 运算 符 的 优先 级 ， 其 排列 顺序 是 从 最 低 的 优先 级 (最 松散 地 结合 ) 到 
最 高 的 优先 级 (最 紧密 地 结合 )。 这 意味 着 在 计算 一 个 表达 式 时 ，Python 首先 计算 列 在 表 下 
部 的 运算 符 ， 然 后 再 计算 列 在 表 上 部 的 运算 符 。 


表 2-2 ”Python 运算 符 的 优先 级 























运算 符 描述 

lambda Lambda 表达 式 
or 布尔 或 
and 布尔 与 
notx 布尔 非 
in、not in 成 员 测 试 
is、is not 同一 性 测试 
<、<=、>、>=、(=、 一 比较 

按 位 或 
% 按 位 异 或 
& 按 位 与 
Sy 移 位 
+、- 加 法 与 减法 
于 、/、% 乘法 、 除 法 、 取 余数 
+x、-X 正 负 号 
~x 按 位 翻转 
六 指数 
x.attribute 属性 参考 
x[index] 下 标 
x[index:index] 寻 址 段 
flarguments...) 函数 调用 
(expression,...) 绑 定 或 元 组 显示 
[expression,...] 列表 显示 
{key:datum,...} 字典 显示 
“expression,...” 字符 串 转换 


上 述 运 算 符 优先 级 表决 定 了 哪个 运算 符 在 别 的 运算 符 之 前 计算 。 然 而 ， 如 果 想 要 改变 
它们 的 计算 顺序 ， 可 以 使 用 圆 括号 。 例 如 ， 想 要 在 一 个 表达 式 中 让 加 法 在 乘法 之 前 计算 ， 
那么 就 要 写成 类 似 于 (1+ 2)* 3 的 形式 。 

















3. Python 运算 符 的 结合 
运算 符 通常 自 左 向 右 结合 ， 
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规律 
即 具有 相同 优先 级 的 运算 符 按 照 从 左 向 右 的 顺序 计算 。 例 


第 2 章 Python 话语 基础 全 
如 ，1 +2+3 被 解释 为 (1 + 2)+3。 也 有 一 些 运算 符 是 自 右 向 左 结合 的 ， 如 赋值 运算 符 。 这 
样 的 运算 符 ， 其 结合 顺序 正 相 反 ， 即 a=b=c 被 解释 为 a= b = o]。 
通 注意 : 合理 使 用 括号 能 够 增强 代码 的 可 读 性 。 在 很 多 场合 下 ， 使 用 括号 都 是 一 个 好 
主意 ， 而 没 用 括号 的 话 ， 可 能 会 使 程序 得 到 错误 的 结果 ， 或 使 代码 的 可 读 性 
降低 ， 引 起 阅读 者 的 困惑 。 括 号 在 Python 语言 中 不 是 必须 存在 的 ， 不 过 为 了 
获得 良好 的 可 读 性 ， 使 用 括号 总 是 值得 的 。 


2.3 字符 串 


1. Python 字符 串 

字符 串 (string) 是 Python 中 最 常用 的 数据 类 型 ，Python 使 用 引号 ( 单 引号 ' 或 双 引号 ") 
作为 字符 串 的 定 界 符 ( 一 般 为 单行 字符 串 ， 多 行 字符 串 使 用 三 引号 ， 稍 后 介绍 )。 

要 创建 一 个 字符 串 ， 只 要 用 成 对 的 引号 把 若干 个 字符 括 起 来 即 可 ， 例 如 : 


varl = "Hello WorlG1 





Var2 = "Python Runoob" 
Python 规定 ， 单 引号 内 可 以 使 用 双 引 号 ， 这 时 双 引 号 被 视 为 一 个 普通 字符 ， 不 再 作为 
定 界 符 ， 反 之 亦 然 。 例 如 : 


strl='I want a book,\n and you want a book,too.' # 单 引号 
str2='"I want a book,\n and you want a book,too."' # 单 引号 中 使 用 双 引 号 
str3="I want a book,\n and you want a book,too." # 双 引号 
str4="'I want a book,\n and you want a book,too.'" # 双 引号 中 使 用 单 引 号 


print (str1l); print (str2); print(str3); print(str4) 


I want a book, 

and you want a book,too. 

"I want a book, 

and you want a book,too." 
I want a book, 

and you want a book,too. 

'I want a book, 

and you want a book,too.' 
>>> | 


一 个 字符 串 用 什么 引号 开头 ， 就 必须 用 什么 引号 结尾 ， 首 尾 定 界 符 不 匹配 时 将 出 错 ， 
例如 : 





>>> str="Wrong string' 
SyntaxError: EOL while scanning string literal 
>>> | 


2. 字符 串 中 值 的 访问 ( 子 串 截取 ) 

与 C 语言 不 同 ，Python 不 支持 字符 类 型 ， 即 使 是 单个 字符 ，Python 也 将 其 视 为 一 个 字 
符 串 来 使 用 。 

访问 子囊， 实际 上 就 是 截取 字符 串 中 的 子 串 ， 有 的 文献 称 其 为 “切片 运算 ”， 使 用 的 
运算 符 是 方 括号 ([] 或 [] 或 [:])， 例 如 : 
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str="0123456789" 

print ("str[0:3]:",str[0:3]) # 截 取 第 一 位 到 第 三 位 的 字符 

print ("str[:]:",str[:]) # 截 取 字 符 串 的 全 部 字符 

print ("str[6:]:",str[6:]) # 截 取 第 七 个 字符 到 结尾 

print ("str[:-3]:",str[:-3]) # 截 取 从 头 开始 到 倒数 第 三 个 字符 之 前 
print ("str[2]:",str[2]) # 截 取 第 三 个 字符 

print ("str[-1]:",str[-1]) # 截 取 倒数 第 一 个 字符 

print ("str[::-1]:",str[::-1]) # 创 建 一 个 与 原 字符 串 顺序 相反 的 字符 串 
print ("str[-3:-1]:",str[-3:-1]) # 截 取 倒 数 第 三 位 与 倒数 第 一 位 之 前 的 字符 
print ("str[-3:]: "vstr[-3:]) # 截 取 倒 数 第 三 位 到 结尾 

print ("str[:-5:-3]:",str[:-5:-3]) # 逆 序 截取 


上 述 程序 段 的 运行 结果 如 下 : 
Stz[0:3] : 012 
str[:]: 0123456789 
str[6:]: 6789 
str[:-3]: 0123456 
seelals 
str[-1]: 9 
str[::-1]: 9876543210 
str[-3:-1]: 78 


从 上 面 的 例子 可 以 看 出 :要 获得 单个 字符 ， 应 使 用 切片 运算 符 si]， 但 i 不 能 省 略 ; 
@ 要 获得 一 个 连续 的 子 串 ， 应 使 用 切片 运算 符 s[ij]， 它 返回 字符 串 s 中 从 索引 (包括 i) 到 
j( 不 包括 j) 之 间 的 子 串 ， 若 i 被 省 略 ，Python 就 认为 i=0， 若 j 被 省 略 ，Python 就 认为 
j=len(s)-1， 其 中 len(s) 表 示 字 符 串 的 长 度 ( 稍 后 介绍 ); @@ 要 每 间隔 若干 字符 返回 一 个 字符 ， 
应 使 用 切片 运算 符 s[ij:k]，k 为 间隔 字符 的 个 数 ，k 为 正 数 表示 从 左 向 右 截取 ， 为 负数 表 
示 从 右 向 左 截取 ，k 不 能 为 0。 不 难 想 象 ，s[::-1] 获 得 的 将 是 逆序 的 整个 字符 串 。 


3.，Python 字符 串 的 更 新 
不 能 企图 通过 切片 运算 更 新 已 存在 的 字符 串 ， 如 : 


>>> str='0123456789" 
>>> str[0]="'a' 
Traceback (most recent call last): 
File "<pyshell#3>", line 1, in <module> 
| str[0]='a' 
民生 六 半 'str' object does not support item assignment 
| >>> 
必须 使 用 Python 的 内 建 函 数 replace0 实 现 字符 串 的 更 新 ， 例 如 : 
>>> str.replace('0','a') 
"al23456789" 
>>> | 





| 











目 
4. Python 字符 串 中 的 转 义 字符 


当 字 符 串 中 需要 使 用 特殊 字符 时 ， 可 以 像 C 语言 那样 ， 在 特殊 字符 前 冠 以 反 斜 杠 ()， 
形成 转 义 字符 。Python 的 转 义 字符 如 表 2-3 所 示 。 
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on 


表 2-3 Python 的 转 义 字符 





























转 义 字符 描 述 
\( 在 行 尾 时 ) 续 行 符 
\ 反 斜 杠 符号 
V 单 引号 
记 双 引 号 
\a 响 铃 
\b 退 格 (Backspace) 
\e 转 义 
\000 空 
un 换行 
YY 纵向 制 表 符 
tt 横向 制 表 符 
Yr 回 车 
¥ 换 页 
\Oyy 八进制 数 yy 代表 的 字符 ， 例 如 : \012 代表 换行 
Wyy 十 六 进 制 数 yy 代表 的 字符 ， 例 如 : \x0a 代表 换行 
other 其 他 的 字符 以 普通 格式 输出 


5. Python 的 字符 串 运 算 符 
假如 a 变量 的 值 为 字符 串 “Hello"， 而 b 变量 的 值 为 字符 串 "Python"， 那 么 ， 各 种 运算 





























结果 如 表 2-4 所 示 。 
表 2-4 Python 的 字符 串 运算 符 
操作 符 描 述 实例 
生 字符 串 连接 atb 输出 结果 : HelloPython 
本 重复 输出 字符 串 a*2 输出 结果 : HelloHello 
0 通过 索引 获取 字符 串 中 的 字符 a[1] 输出 结果 : e 
Li 截取 字符 串 中 的 一 部 分 (切片 ) a[1:4] 输出 结果 : ell 
in 成 员 运算 符 一 一 如 果 字 符 串 中 包含 给 定 的 字符 ， 则 返回 True “Hin a 输出 结果 : 1 
not in 成 员 运 算 符 一 一 如 果 字 符 串 中 不 包含 给 定 的 字符 ， 则 返回 True ”| “Mi? not ina 输出 结果 : 1 
原始 字符 串 所 有 的 字符 串 都 是 直接 按照 字面 的 意思 来 使 | print rw?) 输出 结果 : n 
用 ， 没 有 转 义 为 特殊 的 或 不 能 打印 的 字符 。 原 始 字符 串 除 在 字 | print (Ren) 输 出 结果 : n 
符 串 的 第 一 个 引号 前 加 上 字母 r( 可 以 大 小 写 ) 以 外 ， 与 普通 字符 
串 有 着 几乎 完全 相同 的 语法 
% 格式 化 字符 串 见 后 文 叙述 
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下 面 将 上 述 字 符 串 运算 放 入 一 个 程序 中 : 


#!/usr/bin/python3 
a = "Hello™ 
b = "Python" 
print ("a + b 输出 结果 : "，a + b) 
printl(ma xy 2 输出 结果 :ax 2) 
print ("a[1] 输出 结果 : "，a[1]) 
print ("a[1:4] 输出 结果 : "，a[1:4]) 
yb 

print ("H 在 变量 a 中 ") 
else 

print ("H 不 在 变量 a 中 ") 
EN mot mn ys 

print ("M 不 在 变量 a 中 ") 
Sle 

print ("M 在 变量 a 中 ") 
print(r'\n') 
print (R'\n') 


以 上 程序 的 输出 结果 如 下 : 
>>> 
a + b 输出 结果 : HelloPython 
a * 2 输出 结果 : HelloHello 
a[1] 输出 结果 : e 
a[1:4] 输出 结果 : ell 
H 在 变量 a 中 
M 不 在 变量 a 中 
\n 
\n 
>>> | 


6. Python 字符 串 的 格式 化 

Python 支持 字符 串 的 格式 化 输出 。 尽 管 这 样 做 可 能 会 使 表达 式 非 常 复杂 ， 
用 法 是 将 一 个 值 插入 到 一 个 有 字符 串 格式 符 %s 的 字符 串 中 。 

在 Python 中 ， 字 符 串 格式 化 的 语法 与 C 中 printf 函数 相似 。 我 们 看 下 Ff 
>>> print ("我 叫 $s, 今 年 sd 岁 !" 名 (' 张 三 '，20)) 
我 叫 张 三 , 今 年 20 岁 ! 
>>> | 


Python 字符 串 格式 化 用 到 的 符号 如 表 2-5 所 示 。 
表 2-5 ”Python 字符 串 格式 化 用 到 的 符号 























但 最 基本 的 


面 的 例子 ， 











符 号 描 述 
%e 格式 化 字符 及 其 ASCI 码 
%s 格式 化 字符 串 
%d 格式 化 整 型 数 
ou 格式 化 无 符号 整 型 数 
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续 表 
符 号 描 述 
%o 格式 化 无 符号 八进制 数 
x 格式 化 无 符号 十 六 进 制 数 
%X 格式 化 无 符号 十 六 进 制 数 (大 写 ) 
%f 格式 化 浮 点 数 ， 可 指定 小 数 点 后 的 精度 
%e 用 科学 计数 法 格式 化 浮 点 数 
%E 作用 同 %e， 用 科学 计数 法 格式 化 浮 点 数 
%g 按 %f 和 %e 的 较 短 者 输出 
%G 按 %f 和 %E 的 较 短 者 输出 
%p 用 十 六 进 制 数 格式 化 变量 的 地 址 


格式 化 操作 符 前 面 可 以 加 入 辅助 操作 符 ， 这 一 点 也 与 C 语言 极为 相似 。Python 的 格式 























化 辅助 操作 符 如 表 2-6 所 示 。 
表 2-6 ”Python 格式 化 辅助 操作 符 
符 号 功 能 
定义 宽度 或 者 精度 
输出 左 对 齐 

二 在 正 数 前 面 显示 加 号 (+) 

<sp> 

# 在 八进制 数 前 面 显 示 零 (0")， 在 十 六 进 制 数 前 面 显 示 “0x* 或 者 “0X*( 取 决 于 用 的 是 ‘x* 还 是 'X’) 
0 显示 的 数字 前 面 填充 “0 而 不 是 默认 的 空格 

% “%%0 输 出 一 个 单一 的 '%6* 

(var) 映射 变量 (字典 参数 ) 

mn m 是 显示 的 最 小 总 宽度 ，n 是 小 数 点 后 的 位 数 ( 如 果 可 用 的 话 ) 

尽管 使 用 格式 化 操作 符 输 出 字符 串 很 方便 ， 而 且 与 C 语言 兼容 ， 但 Python 并 不 推荐 

ban 具体 原因 参见 本 书 4.1.2 小 节 。 


含 换 


7.，Python 的 三 引号 


Python 的 三 引号 (三 个 单 引号 或 三 个 双 引 号 均 可 ) 用 于 字符 串 跨 多 行 ， 字 符 串 中 可 以 包 
行 符 、 制 表 符 以 及 其 他 特殊 字符 。 举 例如 下 : 


>>> para str = 字符 串 的 实例 
多 行 字符 串 可 以 使 用 
TAB ( 


t )。 
也 可 以 使 用 换行 符 





>>> print (para str) 
这 是 Python 多 行 字 符 串 的 实例 
多 行 字符 串 可 以 使 用 制 表 符 


TAB ( ) 。 
也 可 以 使 用 换行 符 [ 
] 。 








>>> | 
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三 引号 把 程序 员 从 引号 和 特殊 字符 串 的 泥潭 里 解脱 出 来 ， 自 始 至 终 保持 一 小 块 字符 串 


的 格式 ， 符 合 所 见 即 所 得 (What You See Is What You Get，WYSIWYG) 的 特征 。 


一 个 典型 的 应 用 是 ， 当 需要 一 段 HTML 或 者 SQL 时 ， 如 果 用 字符 串 组 合 转 义 字符 ， 





将 会 非常 繁琐 ， 而 使 用 三 引号 不 失 为 一 种 绝 佳 的 选择 ， 例 如 : 


GETFTHEMID 由 

<HTML><HEAD><TITLE> 

Friends CGI Demo</TITLE></HEAD> 
<BODY><H3>ERROR</H3> 

<B>%s</B><P> 

<FORM><INPUT TYPE=button VALUE=Back 
ONCLICK="window.history.back()"></FORM> 
</BODY></HTML> 

5 

CUESOEeGXecdte 人 

CREATE TABLE Users ( 

login VARCHAR(8), 

uid INTEGER, 

prid INTEGER) 

ey 


三 引号 中 可 以 使 用 成 对 出 现 的 字符 串 定 界 符 ， 例 如 : 


str5='''I want a book,and you want a book,\n too.''' # 三 单 引 号 
str6='''"I Want a book,and you want a book,\n too.™"™''"' 


# 三 单 引号 中 间 使 用 双 引 号 


str7="''"'I want a book, 

and you want a book,\n too.''' # 三 单 引号 中 有 换行 符 
Str8="""I want a book, 

and you want a book, \n too."""  # 三 双 引 号 中 有 换行 符 
print (str5); print (str6); print (str7); Print(str8) 


上 面 程序 段 的 运行 结果 如 下 : 
I want a book,and you want a book, 
too. 
"I want a book,and you want a book, 
too." 


I want a book, 

and you want a book, 
too. 

I want a book, 

and you want a book, 
too. 


注意 : Python 字符 串 的 几 种 定 界 符 均 已 介绍 完毕 ， 现 对 其 归纳 如 下 。 
单 引号 中 可 以 使 用 双 引 号 ， 中 间 的 会 当 作 字 符 串 输出 。 

双 引 号 中 可 以 使 用 单 引 号 ， 中 间 的 会 当 作 字 符 串 输出 。 

三 单 引 号 和 三 双 引 号 中 间 的 字符 串 在 输出 时 保持 原来 的 格式 。 
单 引 号 和 双 引 号 不 能 搭配 使 用 ， 必 须 成 对 使 用 。 


电 四 日 
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8. Unicode 字符 串 


在 Python 2 中 ， 普 通 字 符 串 是 以 8 位 ASCII 码 形式 进行 存储 的 ， 而 Unicode 字符 串 则 
存储 为 16 位 Unicode 字符 串 。 使 用 Unicode 字符 串 ， 旨 在 表示 更 多 的 字符 ， 其 语法 非常 简 
单 ， 只 要 在 字符 串 前 面 加 上 前 级 uu 即 可 。 

Python 3 中 默认 所 有 的 字符 串 都 为 Unicode 的 ， 因 而 不 必 在 字符 串 的 前 面 加 前 级 u。 

9. 原始 字符 串 
前 面 讲解 字符 串 运算 符 时 已 提 及 原始 字符 串 并 举例 ( 表 2-4)， 此 处 再 强调 一 下 。 在 字符 
串 前 面 加 字母 + 或 R， 就 是 告诉 Python 解释 器 ， 其 后 的 字符 串 是 原始 字符 串 (Raw String)。 
原始 字符 串 指 的 是 ， 字 符 串 内 的 所 有 字符 均 保 持 其 原 有 的 含义 ， 不 做 转 义 处 理 。 换 言 之 ， 
“wm” 在 原始 串 中 是 两 个 字符 ， 即 “\” 和 “mn”， 而 不 会 被 转 义 为 换行 符 。 由 于 正则 表达 
式 ( 本 章 最 后 介绍 ) 经 常 与 “\” 冲 突 ， 所 以 ， 当 一 个 字符 串 中 使 用 了 正则 表达 式 之 后 ， 往 往 
在 前 面 加 字母 r， 具 体例 子 参见 2.8.2 节 。 此 外 ， 在 描述 文件 路 径 时 ， 往 往 使 用 “\”， 为 避 
免 歧 义 ， 也 往往 在 其 前 面 冠 以 字母 r， 具 体例 子 见 5.1 节 。 

10. Python 的 字符 串 内 建 函数 

Python 的 字符 串 有 很 多 内 建 函 数 ， 常 用 的 如 表 2-7 所 示 。 

表 2-7 常用 的 Python 字符 串 内 建 函 数 
































二 
























































序 号 方法 及 描述 
capitalize() 
将 字符 串 的 第 一 个 字符 转换 为 大 写 
center(width, fillchar) 
返回 一 个 指定 的 宽度 width 居中 的 字符 串 ，fillchar 为 填充 的 字符 ， 默 认为 空格 
count(str, beg=0, end=len(string)) 


返回 str 在 string 里 面 出 现 的 次 数 ， 如 果 指定 beg 或 end， 则 返回 指定 范围 内 str 出 现 的 次 数 





bytes.decode(encoding="‘utf-8”, errors="‘strict”) 

4 Python 3 中 没有 decode 方法 ， 但 我 们 可 以 使 用 bytes 对 象 的 decode0 方 法 来 解码 给 定 的 bytes 
对 象 ， 这 个 bytes 对 象 可 以 由 str.encode0 来 编码 返回 

encode(encoding=“utf-8’, errors="strict’) 

EE 以 encoding 指定 的 编码 格式 编码 字符 串 ， 如 果 出 错 ， 则 默认 报 一 个 ValueError 的 异常 ， 除 
非 errors 指定 的 是 “ignore’ 或 者 replace” 

endswith(suffix, beg=0, end=len(string)) 

6 检查 字符 串 是 否 以 suffix 结束 ， 如 果 指 定 beg 或 者 end， 则 检查 指定 的 范围 内 是 否 以 suffix 
结束 ， 如 果 是 ， 则 返回 True， 和 否则 返回 False 

expandtabs(tabsize=8) 

把 字符 串 中 的 Tab 符号 转 为 空格 ，Tab 符号 默认 的 空格 数 是 8 

find(str, beg=0, end=len(string)) 

8 检测 str 是 否 包含 在 字符 串 中 ， 如 果 用 beg 和 end 指定 范围 ， 则 检查 是 否 包 含 在 指定 的 范围 
内 ， 如 果 是 ， 则 返回 开始 的 索引 值 ， 否 则 返回 -1 
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续 表 
序 号 方法 及 描述 
和 index(str, beg=0, end=len(string)) 
跟 find0 方 法 一 样 ， 只 不 过 如 果 str 不 在 字符 串 中 ， 则 会 报 一 个 异常 
i isalnum() 
如 果 字 符 串 至 少 有 一 个 字符 ， 并 且 所 有 字符 都 是 字母 或 数字 ， 则 返回 True， 否 则 返回 False 
证 isalpha0 
如 果 字 符 串 至 少 有 一 个 字符 ， 并 且 所 有 字符 都 是 字母 ， 则 返回 True， 否 则 返回 False 
七 isdigit() 
如 果 字 符 串 只 包含 数字 ， 则 返回 Trme， 否 则 返回 False 
islower() 
13 如 果 字 符 串 中 包含 至 少 一 个 区 分 大 小 写 的 字符 ， 并 且 所 有 这 些 ( 区 分 大 小 写 的 ) 字 符 都 是 小 
写 ， 则 返回 Tme， 否 则 返回 False 
访 isnumeric() 
如 果 字 符 串 中 只 包含 数字 字符 ， 则 返回 Trme， 否 则 返回 False 
训 isspace() 
如 果 字 符 串 中 只 包含 空格 ， 则 返回 Trme， 否 则 返回 False 
istitle() 
如 果 字 符 串 是 标题 化 的 ( 见 tile0)， 则 返回 Trme， 否 则 返回 False 
isupperO 
村 如 果 字 符 串 中 包含 至 少 一 个 区 分 大 小 写 的 字符 ， 并 且 所 有 这 些 (区 分 大 小 写 的 ) 字 符 都 是 大 
写 ， 则 返回 Tme， 否 则 返回 False 
本 join(seq) 
以 指定 字符 串 作 为 分 隔 符 ， 将 seq 中 所 有 的 元 素 ( 字 符 串 表示 ) 合 并 为 一 个 新 的 字符 串 
汪 len(string) 
返回 字符 串 长 度 ， 即 字符 串 中 字符 的 个 数 
ljust(width[, fillchar]) 
20 返回 一 个 原 字符 串 左 对 齐 ， 并 使 用 fillchar 填充 至 长 度 width 的 新 字符 串 ，fillchar 默认 为 空 
格 
i lower() 
转换 字符 串 中 所 有 大 写字 母 为 小 写 
22 lstripO 
截 掉 字 符 串 左边 的 空格 
maketrans(intab, outtab) 
23 创建 字符 映射 的 转换 表 ， 对 于 接受 两 个 参数 的 最 简单 的 调用 方式 ， 第 一 个 参数 是 字符 串 ， 表 
示 需 要 转换 的 字符 ， 第 二 个 参数 也 是 字符 串 ， 表 示 转 换 的 目标 
max(str) 
返回 字符 串 str 中 最 大 的 字母 
加 min(str) 
返回 字符 串 str 中 最 小 的 字母 
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续 表 


村 
由 


方法 及 描述 





replace(old, new [, max]) 
将 字符 串 中 的 old 替换 成 new。 如 果 max 指定 ， 则 蔡 换 不 超过 max 次 
rfind(str, beg=0, end=len(string)) 
类 似 于 find0 函 数 ， 不 过 是 从 右边 开始 查找 
rindex(str, beg=0, end=len(string)) 
类 似 于 index0， 不 过 是 从 右边 开始 
rjust(width [, fillehar]) 
返回 一 个 原 字 符 串 右 对 齐 ， 并 使 用 fillchar( 默 认 空 格 ) 填 充 至 长 度 width 的 新 字符 串 
rstripO 
删除 字符 串 末尾 的 空格 
split(stt=“", num=string.count(str)) 
31 num=string.count(str)) 以 str 为 分 隔 符 截取 字符 串 ， 如 果 num 有 指定 值 ， 则 仅 截 取 num 个 子 
字符 串 
splitlines([keepends]) 
给 按照 行 (WP?， re， ) 分 隔 ， 返 回 一 个 包含 各 行 作 为 元 素 的 列表 ， 如 果 参 数 keepends 为 
False， 不 包含 换行 符 ， 如 果 为 Trme， 则 保留 换行 符 
startswith(str, beg=0, end=len(string)) 
33 检查 字符 串 是 否 是 以 str 开头 ， 是 则 返回 Tme， 否 则 返回 False。 如 果 beg 和 end 指定 值 ， 则 
在 指定 范围 内 检查 
strip([chars]) 
在 字符 串 上 执行 lstrip0 和 rstripO) 
swapcase() 
将 字符 串 中 大 写 转换 为 小 写 ， 小 写 转换 为 大 写 
titleO) 
36 返回 “标题 化 ”的 字符 串 ， 就 是 说 ， 所 有 单词 都 是 以 大 写 开始 ， 其 余 字 母 均 为 小 写 ( 见 
istitleO 
translate(table, deletechars="*) 
37 根据 table 给 出 的 表 (包含 256 个 字符 ) 转 换 string 的 字符 ， 需 要 过 滤 掉 的 字符 放 到 deletechars 
参数 中 
UpperO 
转换 字符 串 中 的 小 写字 母 为 大 写 
zfill(width) 
返回 长 度 为 width 的 字符 串 ， 原 字符 串 右 对 齐 ， 前 面 填充 0 
isdecimal() 
检查 字符 串 是 否 只 包含 十 进 制 字 符 ， 如 果 是 则 返回 Tme， 否 则 返回 False 
这 些 内 建 函数 为 我 们 处 理 字符 串 带 来 了 极 大 的 方便 。 读 者 学 习 Python 语言 时 ， 不 要 试 
图 自己 编写 程序 来 处 理 字符 串 ， 应 当 充分 利用 这 些 内 建 函数 完成 相应 的 功能 。 
细心 的 读者 可 能 已 经 注意 到 ， 表 2-7 的 标题 上 写 的 是 “函数 ”， 而 表格 栏目 中 谓 之 
“方法 ”。 其 实 ， 函 数 与 方法 并 无 严格 的 区 别 。 在 面向 过 程 的 语言 中 ， 一 个 模块 主要 强调 
的 是 数据 处 理 ， 就 像 数学 上 的 函数 一 样 ， 故 称 为 函数 ， 在 面向 对 象 的 语言 中 ， 一 般 把 类 中 
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定义 的 函数 称 作 方 法 、 服 务 或 操作 ， 因 为 它 主要 强调 这 个 类 的 对 象 封装 了 一 些 属性 和 方法 
(变量 和 函数 ) 并 向 外 提供 服务 。 表 2-7 中 所 列 函数 均 是 定义 在 某 个 类 里 面 的 ， 故 称 为 方 
法 。 说 到 底 ， 方 法 就 是 类 函数 。 

有 鉴于 此 ， 在 不 产生 混淆 的 前 提 下 ， 本 书 的 后 续 章节 拟 不 严格 区 分 函数 与 方法 。 

有 关 类 与 面向 对 象 的 概念 ， 读 者 可 参阅 第 6 章 中 的 相关 内 容 。 

下 面 看 几 个 关于 字符 串 操作 的 例子 (其 中 使 用 了 下 一 节 将 要 介绍 的 列表 ): 





























>>> mystring = "+" 

>>> seq = ['1" 人 

>>> a 

和 本 人 于 全 

>>> myString = "This is an apple and that is an apple too." 


>>> myString.replace('apple'，'orange'，myString.count('apple')) 
"This is an orange and that is an Orange too.' 

>>> myString.-replace('apple'，'orange'，1) 

"This is an orange and that is an apple too.' 

>>> mystring.split(' ', 3) 

i 'is', "an', 'apple and that is an apple too.'] 

>>> 





2.4 列表 与 序列 


在 介绍 列表 之 前 ， 我 们 先 了 解 一 下 Python 中 “序列 ”的 概念 。 在 Python 中 ， 序 列 是 
最 基本 的 数据 结构 。 序 列 中 的 每 个 元 素 都 被 分 配 一 个 数字 ， 以 表明 它 的 位 置 ， 并 称 为 索 
引 。 其 中 ， 第 一 个 索引 值 为 0， 第 二 个 索引 值 为 1， 依 此 类 推 。 

Python 中 的 序列 都 可 以 进行 索引 、 切 片 、 加 、 乘 、 检 查 成 员 等 操作 。 为 了 使 用 方便 ， 
Python 还 内 建 了 确定 序列 长 度 以 及 确定 最 大 和 最 小 元 素 的 方法 。 

Python 中 最 常用 的 序列 是 列表 和 元 组 ， 本 节 介绍 列表 ， 元 组 放 在 下 一 节 介绍 。 

1. 列表 的 概念 


列表 (lisb 是 Python 中 使 用 最 频繁 的 数据 类 型 ， 它 是 放 在 方 括号 [] 内 、 用 逗号 分 隔 的 一 
系列 元 素 。 

列表 中 ， 元 素 的 类 型 可 以 不 同 ， 支 持 数字 、 字 符 串 ， 甚 至 可 以 包含 列表 。 换 言 之 ， 列 
表 人 允许 嵌 套 。 


2. 列表 的 创建 
创建 一 个 列表 时 ， 只 要 把 去 号 分 隔 的 不 同 的 数据 项 用 方 括号 括 起 来 即 可 。 例 如 : 


1ist1 
list2 
List3 


['Google', 'Runoob', 1997, 2017] 
[i, 27 3, 47 5°] 
"am, wpb", "en", nd"] 


与 字符 串 一 样 ， 列 表 同 样 可 以 被 索引 、 截 取 和 组 合 。 列 表 被 截取 后 ， 返 回 一 个 包含 所 
需 元 素 的 新 列表 。 与 字符 串 的 索引 一 样 ， 列 表 索 引 也 是 从 0 开始 的 。 


3. 列表 的 访问 与 截取 
可 以 使 用 下 标 索 引 来 访问 列表 中 的 元 素 ， 同 样 ， 也 可 以 使 用 类 似 于 字符 串 切 片 运算 的 
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形式 截取 列表 中 的 元 素 ， 例 如 : 


>>> listl = ['Goo 















>>> list2 = [1, 2, 3, 
>>> print (" [0] 
list1[0]: 
>>> print ("li 
T1525 
>>> 
‘: 
L=['Google', "Runoob'， "Taobao'] 
则 截取 操作 如 表 2-8 所 示 。 
表 2-8 Python 列表 的 截取 操作 
Python 表达 式 结 果 描 述 
ID 读 取 第 三 个 元 素 
L[-2] ‘Runoob’ 从 右 侧 开始 读 取 倒 数 第 二 个 元 素 





LT] 输出 从 第 二 个 元 素 开始 的 所 有 元 素 
下 面 将 上 述 列表 截取 操作 放 入 一 个 程序 中 : 


#!/usr/bin/python3 

L=["'Google', 'Runoob', 'Taobao'] 
print (L[2]) 

print (L[-2]) 

print (L[1:]) 


以 上 程序 的 输出 结果 如 下 : 
| Taobao 
Runoob 
['Runoob', 'Taobao'] 
>>> 


千 注意 : 字符 串 、 列 表 和 元 组 (下 节 介 绍 ) 三 者 都 是 序列 ， 都 支持 切片 运算 ， 操 作 方 法 也 
极为 相似 ， 只 是 操作 结果 的 类 型 有 所 不 同 。 此 外 ， 不 能 通过 切片 运算 对 字符 
串 和 元 组 进行 更 新 ， 列 表 则 可 以 。 
4. 列表 的 更 新 


可 以 对 列表 的 数据 项 进行 修改 或 更 新 ， 也 可 以 使 用 append() 方 法 ( 稍 后 介绍 ) 添 加 一 些 
列表 项 。 例 如 : 


>>> list = ["( 
>>> print ( ZC 
第 三 个 元 素 为 : 1997 
>>> list[2] = 2001 





















oob', 1997, 2017] 
+ list[2]) 





>>> print ("更 新 后 的 第 三 个 元 素 为 : "，1ist[2]) 
更 新 后 的 第 三 个 元 素 为 : 2001 
>>> | 


5. 列表 元 素 的 删除 
可 以 使 用 del 语句 来 删除 列表 中 的 元 素 ， 例 如 : 
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>>> list = ['Google', "Runoob"，1997，2017] 
>>> print (list) 

['Google', ‘Runoob', 1997, 2017] 

>>> del list[2] 

>>> print (" 删 除 第 三 个 元 系 后 "7 ist) 
全 个 元 素 后 : [5 Ceo0ler 'Runoob', 2017] 
>>> 


使 用 remove0 方 法 也 可 以 删除 列表 的 元 素 ， 我 介 


6. 列表 操作 符 


稍 后 再 讨论 。 











列表 对 + 和 * 的 操作 符 与 字符 串 相似 。+ 号 上 
+ 和 * 的 用 法 如 表 2-9 所 示 。 








于 组 合 列表 ，* 号 用 于 重复 列表 。 


表 2-9 列表 中 + 和 * 的 用 法 





Python 表达 式 结 果 描述 
len([1, 2, 3]) 3 长 度 ( 即 列表 中 元 素 的 个 数 ) 
[L2.3]+[45.g 组 台 ( 即 拼 搓 ) 

[Hir]*4 [Hi “Hit, ‘Hit", Hi] | 重复 
3in [1,2,3] 元 素 是 否 存 在 于 列表 中 
for x in [1, 2, 3]: print (x,end=" 7) 遍历 并 输出 列表 的 各 个 元 素 





肖 注意 ; 为 了 让 列表 的 各 个 元 素 打印 在 一 行 上 ， 而 且 相 邻 两 个 元 素 之 间隔 一 个 空格 ， 


表 2-9 的 最 后 一 行使 用 了 print (x,end=“ 


”) 这 种 打印 格式 ， 后 面 遍历 元 组 和 集合 


时 采用 了 同样 的 方法 ，3.4.6 节 对 此 将 做 详解 。 


7. 列表 谈 套 
列表 嵌 套 指 的 是 在 列表 : 里 创建 


>>> a= [" Sl 
>>> n= [1 2, 3 

>>> x = [a, n] 

>>> x 











他 列表 ， 例 如 : 





'c'], [1, 2, 3]] 


ei | 
>>> x[0] [1] 


>>> | 
8. Python 列表 中 的 内 建 函 数 与 方法 
Python 列表 中 的 内 建 函 数 如 表 2-10 所 示 。 





表 2-10 Python 列表 中 的 内 建 函数 















































.ao 





序 号 函 数 
1 len(list) ”返回 列表 元 素 的 个 数 
2 max(list) ”返回 列表 元 素 的 最 大 值 
3 min(list) 返回 列表 元 素 的 最 小 值 
4 list(seq) 将 元 组 、 字 典 、 集 合 、 字 符 串 等 转换 为 列表 
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Python 列表 中 的 方法 如 表 2-11 所 示 。 
表 2-11 Python 列表 中 的 方法 









































序 号 方 法 

和 list.append(obj) 在 列表 末尾 添加 新 的 对 象 

4 list.count(obj) ”统计 某 个 元 素 在 列表 中 出 现 的 次 数 

3 list.extend(seq) ”在 列表 末尾 一 次 性 追加 男 一 个 序列 中 的 多 个 值 (用 新 列表 扩展 原来 的 列表 ) 
4 list.index(obj) 从 列表 中 找 出 某 个 值 第 一 个 匹配 项 的 索引 位 置 

5 list.insert(index, obj) 将 对 象 插入 列表 

6 list.pop(obj=list[-1]) 移 除 列表 中 的 一 个 元 素 (默认 最 后 一 个 元 素 )， 并 且 返 回 该 元 素 的 值 
7 list.remove(obj) 移 除 列表 中 某 个 值 的 第 一 个 匹配 项 

8 list.reverse() ”将 列表 中 5 素 反 向 

9 list.sort([func]) “对 原 列表 进行 排序 

10 listclear0 ”清空 列表 

11 listcopy0 ”复制 列表 


下 面 看 几 个 列表 操作 的 例子 : 
>>> # 回 列表 尾部 添加 元 素 
>>> a=[1,2,3,4] 
>>> a.append (5) 
>>> print (a) 

[1, 2, 3, 4, 5] 


>>> a=[1,2,4] 
>>> a.insert (2,3) 
>>> print (a) 
[1, 2, 3, 4] 


>>> | 

>>> # 扩 展 列 表 

>>> a=[1,2,3] 

>>> b=[4,5,6] 

>>> a.extend (b) 
>>> print (a) 

[1, 2, 3, 4, 5, 6€] 
>>> | 

>>> # 册 | 除 元 素 (如 有 重复 元 素 ， 只 会 删除 最 靠 前 的 ) 
>>> a=[1,2,3,2] 

>>> a.remove (2) 

>>> print (a) 

旧 ; 3, 2] 

>>> | 
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>>> 4# 册 | 除 指定 位 置 的 元 素 ， 默 认为 最 后 一 个 元 素 
>>> a=[iy Zr 3r 4 5 6] 

>>> a.pop() 

6 

>>> print(a) 

[1, 2, 3, 4, 5] 

>>> a.pop (3) 

4 


>>> print (a) 

[1 2, 37 5] 

>>> | 

>>> # 逆 序 

> AS 61 
>>> a.reverse() 

>>> print(a) 

[6: 5, 4 3: 2; 1] 
>>> | 

>>> # 排 序 

>>> a=[2,4,7,6,3,1,5] 
>>> a.sort() 

>>> print (a) 

(rn 27 37 47 S37 0677] 
>>> | 


25 元 组 
Python 的 元 组 (tuple) 与 列表 相似 ， 不 同 之 处 在 于 元 组 的 元 素 是 不 能 修改 的 。 另 外 ， 列 
表 使 用 方 括号 []， 而 元 组 使 用 圆 括号 0)。 
1. 元 组 的 创建 
元 组 的 创建 很 简单 ， 只 需要 在 括号 中 添加 元 素 ， 并 使 用 逗号 分 隔 各 元 素 即 可 。 例 如 : 


tupl = ('Google', 'Runoob', 1997, 2017) 
Ew = Ml oY 
tup3 = (van, "b", "ec", "qd") 
创建 空 元 组 时 ， 使 用 如 下 语句 : 
tupl = () 

迁 注意 : 


@。 当 元 组 中 只 包含 一 个 元 素 时 ， 需 要 在 元 素 后 面 添加 过 号 ， 例 如 tupl = (50,)。 
@ “与 字符 串 类 似 ， 元 组 的 下 标 索 引 也 从 0 开始 ， 而 且 也 可 以 进行 截取 、 组 合 等 操作 。 


2. 元 组 的 访问 
可 以 使 用 下 标 索 引 来 访问 元 组 中 的 元 素 ， 例 如 : 
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>>> tupl ('Google', ‘'Runoob', 1997, 2017) 

>>> tup2 1 0 0 

>>> print ("tupl[0]: ", tupl[0]) 

tupl[0]: Google 

Sy Drink ("topZl1i:51> "Lovelliss]) 
Se | 


>>> 
3. 元 组 的 修改 


如 前 所 述 ， 元 组 中 的 元 素 值 是 不 允许 修改 的 ， 但 可 以 对 元 组 进行 连接 组 合 。 假 如 : 
>>> tupl = (12, 34.56) 
>>> tup2 = ('abc', ‘'xyz') 
以 下 修改 元 组 元 素 的 操作 是 非法 的 : 
>>> tupl[0] = 100 
Traceback (most recent call last): 
File "<pyshell#2>", line 1, in <module> 
tupl[0] = 100 
TypeError: 'tuple' object does not support item assignment 
>>> 
但 可 以 通过 连接 运算 符 “+” 创 建 一 个 新 的 元 组 : 
>>> tup3 = tupl + tup2 
>>> print (tup3) 
{i227 3 "abee "XYyz") 
| >>> | 
4. 元 组 的 删除 
既然 元 组 不 能 修改 ， 那 么 其 中 的 元 素 值 也 就 不 允许 删除 ， 但 我 们 可 以 使 用 del 语句 删 
除 整个 元 组 ， 例 如 : 
上 >>> tup = ('Google', 'Runoob', 1997, 2017) 
>>> print (tup) 
('Google', 'Runoob', 1997, 2017) 
>>> del tup 
>>> print (tup) 
Traceback (most recent call last): 
File "<pyshell#3>", line 1, in <module> 
print (tup) 
NameError: name 'tup' is not defined 
>>> | 


可 见 ， 元 组 被 删除 后 ， 再 输出 该 元 组 时 会 显示 异常 信息 。 

5. 元 组 运算 符 

与 字符 串 类 似 ， 元 组 之 间 可 以 使 用 + 号 和 * 号 进行 运算 。 这 就 意味 着 可 以 将 它们 组 
合 和 复制 ， 运 算 后 将 生成 一 个 新 的 元 组 。 

表 2-12 给 出 了 几 个 例子 。 
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表 2-12 ”Python 元 组 的 运算 符 

















Python 表达 式 描 述 
len((1, 2, 3)) 3 计算 元 素 个 数 
(1, 2, 3) + (4, 5, 6) (1, 2, 3, 4, 5, 6) 连接 
CHiP)*4 (Hi ‘Ein, Hir, Hi | 重复 
3in(l,2, 3) True 元 素 是 否 存在 于 元 组 中 
for x in (1, 2, 3): print (x.end= 7) 123 遍历 并 输出 元 组 的 各 个 元 素 


6. 元 组 的 索引 、 截 取 


前 已 提 及 ， 元 组 是 一 个 序列 ， 所 以 可 以 访问 元 组 中 指定 位 置 的 元 素 ， 也 可 以 通过 索引 
截取 元 组 中 的 一 段 元 素 。 假 设 元 组 为 L = (“Google’, “Taobao’, ‘Runoob”)， 表 2-13 说 明了 元 
组 的 索引 和 截取 。 


表 2-13 ”Python 元 组 的 索引 和 截取 


(‘Taobao’, ‘Runoob!’) 


运行 结果 如 下 : 
>>> L = {'Google', 'Taobao', 'Runoob') 
>>> L[2] 
"Runoob 
>>> L[-2] 
"Taobao' 
>>> L[1:] 
('Taobao', "Runoob ') 
>>> | 


7. 元 组 的 内 建 函数 








Python 元 组 包含 了 一 些 内 建 函 数 ， 如 表 2-14 所 示 。 
表 2-14 ”Python 元 组 的 内 建 函数 










方法 及 描述 








>>> tuplel = ('Goog] 
>>> len(tuplel) 





len(tuple) 
计算 元 组 中 元 素 的 个 数 









>>> tuple2 = ('5" 
>>> max (tuple2) 





max(tuple) 
返回 元 组 中 元 素 的 最 大 值 
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续 表 
方法 及 描述 举 _ 例 
>>> tuple2 = ('5', '4', '8') 
min(tuple) >>> min(tuple2) 
返回 元 组 中 元 素 的 最 小 值 “| “4 
>>> | 
So 1StI [LG 1 Taobao' "Runoob'， ‘'Baidu'] 
tuple(seq) >>> i ii 
将 列表 、 字 符 申 、 字 典 、 | >>> tuplel 





('Google', 'Taobao', 'Runoob', "Baidu') 


集合 等 转换 为 元 组 a 
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届 


1. 字典 的 概念 


Python 中 的 字典 (dictionary) 是 一 种 可 变 容器 模型 ， 且 可 以 存储 任意 类 型 的 对 象 。 

字典 中 的 每 个 项 都 是 “ 键 / 值 对 ”( 有 了 时 写作 “ 键 - 值 对 ”或 “ 键 值 对 ”)，“ 键 ”与 
“ 值 ”之 间 用 冒号 (分隔 ， 而 每 个 “对 ”之 间 用 逗号 () 分 隔 ， 整 个 字典 放 在 花 括号 全 中， 
格式 如 下 : 

d= {keyl : valuel, key2 : value2 } 

对 每 个 键 / 值 对 而 言 ， 键 必须 是 唯一 的 ， 但 值 可 以 改变 。 值 可 以 取 任何 数据 类 型 ， 但 键 
必须 是 不 可 变 的 。 例 如 ， 字 符 串 、 数 字 或 元 组 均 可 作为 键 ， 但 列表 不 可 以 。 


2. 字典 的 创建 


Python 中 创建 字典 的 方法 很 简单 ， 只 要 将 键 值 对 放 入 花 括 号 内 ， 并 用 逗号 隔 开 即 可 。 
一 个 简单 的 字典 例子 如 下 : 


dict = (MAILICOrS "294" "Both MALO Coc 2 "258 


也 可 这 样 创建 字典 : 
ietH Lapseue dG 


dict2 uabcs T23099.602 37 


3. 字典 的 访问 
把 相应 的 键 放 入 方 括号 内 ， 即 可 得 到 相应 的 值 。 例 如 : 


>>> dictl = {'Name':'"'Runoob', 'Age':7,'Class':'First'} 
>>> print ("dictli['Name']",dictl['Name']) 
dictl['Name'] Runoob 

>>> print ("dictl['Age']",dicti['Age']) 

dicti['Age'] 7 

>>> | 


如 果 所 用 的 键 在 字典 中 不 存在 ， 则 数据 无 法 访问 ， 会 输出 错误 信息 ， 例 如 : 
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>>> dictl = {'Name':'Runoob', 'Age':7,'Class':'First'} 
>>> print ("dicti{'Alice']",dictl['Alice']) 


Traceback (most recent call last): 
| File "<pyshell#18>", line 1, in <module> 
print ("dictl['Alice']",dictl['Alice']) 
KeyError: 'Alice' 
>>> | 


4. 字典 的 添加 与 修改 
向 字典 添加 新 的 键 / 值 对 ， 便 向 字典 中 添加 了 新 的 内 容 。 修 改 或 添加 已 有 键 / 值 对 的 例 


子 如 下 : 
>>> dictl = {'Name':'Runoob', 'Age':7,'Class':'First'} 
>>> dictl['age'] = 8 # 更 新 age 
>>> dictl['School'] = "TJPU" # 添 加 信息 


>>> print("dictl['age']:"vdictl['age']) 
dictl['Age']: 8 
>>> print("dictl['School']:w"dictl['School']) 
dict1l['"Schoo1l']: TJPU 

中 >>> | 


5. 字典 元 素 的 删除 


既 能 删除 字典 中 的 单一 元 素 ， 也 能 将 整个 字典 清空 ， 而 且 清空 只 需 一 项 操作 。 
删除 一 个 字典 用 del 命令 ， 例 如 : 


>>> dictl = {'Name': 'Runoob'，'Rge': 7, 'Class': 'First'} 
>>> del dict1['Name'] # 删除 键 'Name' 

>>> dict1 

{'Class': "First', 'Age': 7} 

>>> dictl.clear() # 删除 字典 元 素 

>>> dictl 

{} 

>>> print ("dictl['age']: ", dicti['age']) 


Traceback (most recent call last): 
File "<pyshell#25>", line 1, in <module> 
print ("dictl['Age']: ", dictl['Age']) 
KeyError: 'Age' 
>>> del dict1 # 删除 字典 
>>> print ("dictl['Age']: ", dictl['age']) 
Traceback (most recent call last): 
File "<pyshell#27>", line 1, in <module> 
print ("dicti['Age']: ", dicti['Age']) 
NameError: name 'dictl' is not defined 
>>> dictl 
Traceback (most recent call last): 
File "<pyshell#28>", line 1, in <module> 
dictl 
NameError: name "dictl' is not defined 
>>> | 


第 一 次 引发 异常 是 因为 字典 中 已 无 元 素 ( 空 字典 )， 试 图 访问 键 ‘age’ 会 出 错 ; 第 二 次 引 
发 异常 是 因为 前 面 已 执行 了 del 操作 ， 字 典 已 不 复 存在 ， 当 然 不 能 访问 键 ‘age’; 第 三 次 引 
发 异常 也 是 因为 字典 不 存在 ， 所 以 两 次 引发 异常 的 名 称 均 为 NameError。 

6. 字典 键 的 特性 

字典 的 值 可 以 取 任 何 Python 对 象 ， 没 有 任何 限制 ， 它 既 可 以 是 标准 对 象 ， 也 可 以 是 用 
户 自己 定义 的 对 象 ， 但 键 不 行 。 
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关于 字典 的 键 ， 有 两 点 必须 牢记 。 
(1) 同一 个 键 不 得 出 现 两 次 。 创 建 字典 时 ， 如 果 同 一 个 键 被 赋值 两 次 ， 则 后 一 个 值 被 
记 住 ， 例 如 : 


>>> dictl = 

>>> print("d 

dicti['Name'] 小 菜鸟 

>>> 

(2) 键 必须 不 可 变 。 可 以 用 数 : 

>>> dictl = {['Name']:' Ru 

Traceback (most recent ca 
File "<pyshell#5>", line 1, in <module> 

dictl = {['Name']:'Runoob','Age':7} 
TypeError: unhashable type: 'list' 
>>> | 


7. 字典 的 内 建 函 数 与 方法 
Python 字典 包含 的 内 建 函 数 如 表 2-15 所 示 。 
表 2-15 Python 字典 的 内 建 函 数 








es "小 菜鸟 '} 


j",dictil['Name']) 














字符 串 或 元 组 做 键 ， 用 列表 则 不 行 ， 例 如 : 











































序 
函数 及 描述 举 例 
cE 

len(dict) >>> dict = {'Name': 'Runoob', 'Age': 7, 'Class "pirat 
1 “| 计算 字典 元 素 个 数 ， | >>> len(dict) 

3 

即 键 的 总 数 

str(dict) >>> dict = {'N "Rur Age': 7, First'} 
2 | 输出 字典 ， 以 可 打印 | >>> str (dict) 

4 "{'Name': 'Runoob', 'Class': 'First'，'Rge': 7}" 

type(variable) 

扳 全 4 六 >>> dict = {'N: Runoob 'Age 7 First'} 
本 返回 输入 的 变量 类 >>> type (dict) 

型 ， 如 果 变 量 是 字典 | <class 'dict'> 

就 返回 字典 类 型 

















Python 字典 包含 的 内 建 方法 如 表 2-16 所 示 。 
表 2-16 ”Python 字典 的 内 建 方法 








。 函数 及 描述 
radiansdict.clear() 

删除 字典 内 所 有 元 素 
radiansdict.copyO 

返回 一 个 字典 的 浅 拷贝 














radiansdict.fromkeys(seq[, val]) 
3 创建 一 个 新 字典 ， 以 序列 seq 中 的 元 素 做 字典 的 键 ，val 为 字典 所 有 键 对 应 的 初始 值 ( 缺 省 时 为 


None) 
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函数 及 描述 
radiansdict.get(key, default=None) 
返回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 则 返回 default 值 
key in dict 
如 果 键 在 字典 dict 里 ， 则 返回 True， 否 则 返回 False 





radiansdict.items() 




















以 列表 返回 可 遍历 的 ( 键 , 值 ) 元 组 数组 
radiansdict.keys() 
以 列表 返回 一 个 字典 所 有 的 键 








radiansdict.setdefault(key, default=None) 

与 get0 类 似 ， 但 如 果 键 不 存在 于 字典 中 ， 将 会 添加 键 并 将 值 设 为 default 
radiansdict.update(dict2) 

把 字典 dict2 的 键 / 值 对 更 新 到 字典 里 

radiansdict.values() 


以 列表 返回 字典 中 的 所 有 值 


下 面 看 几 个 典型 的 例子 : 
>>> # 返 回 一 个 具有 相同 刍 - 值 对 的 新 字典 溢 复 制 ) 























>>> y=x.copy() 
>>> Y['name"]='Ylh' # 营 换 值 ， 原 字典 不 受 影响 








>>> yl['m '] .remove ('bar') # 修 改 了 某 个 值 ( 原 地 修改 不 是 蔡 换 ) ， 原 字典 会 改变 
>>> Y 

{'name': 'Ylh'，'machines': ['foo', 'bax']} 

>>> x 

{'name': 'admin', 'machines': ['foo', 'bax']} 


>>> 

?党 4 使 用 给 定 的 外 建立 新 的 字典 ， 每 个 键 默认 的 对 应 的 值 为 none 
>>> {}.fromkeys(['name','sex','age']) 
{'name': None, "age None, 
>>> dict.fromkeys(['name','s 
{'name': None, ‘age': None, 
>>> dict.fromkeys (['name 
{'name': '(unknown)', 


>>> | 

>>> # 访 问 指定 键 的 值 

>>> d={} 

>>> print (d['name']) =# 键 不 存在 ， 出 错 

Traceback (most recent call last): 

File "<pyshell#72>", line 1, in <module> 

print (d['name']) # 键 不 存在 ， 出 错 

KeyError: ‘'name" 

>>> print (d.get('name')) 

None 

>>> d.get('name', 'N/A') 

'N/A' 

>>> d['name']="'Eric' 

>>> d.get('name') 

由 

>>> | 











a 
: ' (unknown)'} 
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>>> ## 利 用 一 个 字典 更 新 另外 一 个 字典 
wD: 

>>> f={'y"':5} 

>>> d.update (f) 

>>> d 

EU 

>>> | 


2.7 集 合 


1. 集合 概述 
集合 (set) 是 Python 的 基本 数据 类 型 ， 把 不 同 的 元 素 组 合 在 一 起 便 形 成 了 集合 。 组 成 一 
个 集合 的 成 员 称 作 该 集合 的 元 素 (elemenb 。 在 一 个 集合 中 不 能 有 相同 的 元 素 。 下 面 是 集合 
的 例子 : 
a 从 
>>> se =set (1i) 
>>> se 
,tk 
>>> | 
可 以 看 到 ， 相 同 的 元 素 被 自动 删除 了 。 
集合 对 象 是 一 组 无 序 排列 的 可 哈 希 的 值 ， 集 合成 员 可 以 作为 字典 的 键 。 相 比 之 下 ， 列 
表 对 象 是 不 可 哈 希 的 ， 所 以 下 面 的 程序 会 出 错 : 
Til a el 
>>> se = set(1i) 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
se = set(1i) 
TypeError: unhashable type: 'list' 
>>> 


集合 可 以 分 为 两 类 : 可 变 集合 (set) 与 不 可 变 集合 (frozenset)。 
可 变 集合 可 添加 和 删除 元 素 ， 是 非 可 哈 希 的 ， 不 能 用 作 字 典 的 键 ， 也 不 能 做 其 他 集合 
的 元 素 。 而 不 可 变 集合 与 之 相反 。 
2. 集合 操作 符 和 关系 符号 
集合 有 各 种 操作 ， 各 种 操作 符 和 关系 符号 如 表 2-17 所 示 。 
表 2-17 集合 操作 符 和 关系 符号 




















Python 符号 
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续 表 

















3. 集合 的 相关 操作 


(1) 集合 的 创建 。 
由 于 集合 没有 目 CE 只 能 通过 集合 的 工厂 方法 set0 和 frozenset0 来 创建 


>>> 5 = set(' 2 
>>>s 








{'g', ba rn 'e'} 
>>> 七 = frozenset('p 

>>> 七 

frozenset (tyY 7 "hy ar DY "tr ny "Os ‘mm}) 


>>> type(s),type(t) 

(<class 'set'>, <class 'frozenset'>) 
>>> len(s),1en(t) 

(7, 8) 

>>> s==t 

False 

>>> s=t 

>>> s==t 

True 

>>> 


(2) 集合 的 访问 。 

由 于 集合 本 身 是 无 序 的 ， 所 以 不 能 像 列 表 和 元 组 那样 ， 为 集合 创建 索引 或 进行 切片 操 
作 ， 只 能 循环 遍历 或 使 用 in、not in 来 访问 或 判断 集合 元 素 ( 有 关 循 环 的 内 容 将 在 下 一 章 中 
做 具体 介绍 ): 


>>> 'a' in s 
True 
>>> 'z' 可， 
False 
>>> for i in s: 
print (i,' ',end="'') 








hap Eno nm 
>>> 


(3) 集合 的 更 新 。 
Python 内 建 了 以 下 方法 ， 可 以 实现 集合 的 更 新 : 
s.add() 


s-update () 
s.remove() 


然 ， 只 有 可 变 集合 才能 更 新 ， 试 图 更 新 不 可 变 集合 将 会 出 错 。 例 如 : 
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>>> s.add(0) 
Traceback (most recent call last): 
File "<pyshell#12>", line 1, in <module> 

s-add(0) 

AttributeError: 'frozenset' object has no attribute "add' 

>>> type(s) 

<class 'frozenset'> 

>>> se = set(s) 

>>> se 

{yr hs ‘ar, pr, tr, mn, om 

>>> type (se) 

<class "set'> 

>>> se.add(0) 

>>> se 

{0 y's hy ‘al, pt ny om 

>>> se.update('MM') 

>>> se 

{0, yr, hs al, po ty mn, or, mm, NM) 

>>> se.update('Django') 

>>> se 

{0, rg', 3 1y', tT ‘ty Nn, ‘Oo, mMm', 'M', 'D' 

>>> se.remove('D') 


>>> se 
{On go vu ry nv va apo oe ON 
>>> 


内 建 的 del 命令 可 以 删除 集合 本 身 。 
4. 集合 类 型 操作 符 


集合 类 型 操作 符 有 7 类 。 

(1) in、not in( 是 否 是 集合 的 元 素 )。 

(2) 一 、[=( 集 合 等 价 与 不 等 价 )。 

(3) 子 集 、 超 集 ( 见 表 2-17)。 例 如 : 
>>> set('shop')<set('cheeshop') 
True 
>>> set('bookshop')>=set('shop') 
True 
>>> 


(4) 联合 (|)。 
联合 (union) 操 作 与 集合 的 or 操作 其 实 是 等 价 的 ， 联 合 操 作 符 还 有 一 个 与 之 等 价 的 方法 
union()。 例 如 : 


>>> sl=set('begin') 

>>> s2=set ("man') 
| >>> s3=s11s2 

>>> s3 

下 bh 二 Ey A 1 由" 十 
>>> sl.union(s2) 

人 bi 站 汪 ‘ey, ET me es vy 


但 + 运算 则 不 可 用 于 集合 : 
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>>> s3New = sl+s2 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
S3New = sl+s2 
TypeError: unsupported operand type(s) for +: 'set' and 'set' 
>>> 
(5) 交集 (&)。 
与 集合 的 and 操作 等 价 ， 交 集 符号 & 的 等 价 方法 是 intersection()。 例 如 : 
川 >>> slss2 
中 tn7) 
>>> sl.intersection(s2) 
ny 
>>> | 
(6) 差 补 (-)。 
与 之 等 价 的 方法 是 difference()。 
>>> 51=52 
tr Te 
>>> sl.difference(s2) 
+ ek Sh/ 
>>> | 
(7) 对 称 差分 (9。 
对 称 差 分 是 集合 的 xor( 异 或 )， 取 得 的 元 素 属 于 sl 和 s2， 但 不 同时 属于 sl 和 s2， 其 等 


价 的 方法 是 symmetric_difference()。 例 如 : 
>>> sl=set ('begin') 

>>> s2=set ('man') 

> S182 

(ii rg', ‘a', 'e', 'b', 'm'} 
>>> sl.symmetric difference(s2) 
ra ra er 
>>> 

注意 集合 之 间 的 and、or 运算 : 

>>> sl and s2 

as a', i 

> lL OF 32 
Ty 

>>> 

可 见 ，sl and s2 运算 取 的 是 s2， 而 sl or s2 运算 取 的 是 s1。 


5. 集合 转换 为 字符 串 、 元 组 
举例 如 下 : 


>>> str(s1) 

nfre ibm gj 
>>> tuple(s1) 

(ea bo no 'g') 
>>> 


6. 关于 集合 的 内 建 函 数 、 内 建 方法 

(1) len0: 返回 集合 元 素 的 个 数 。 

(2) set()、frozenset(): 创建 集合 ( 属 工厂 函数 )。 
(3) 适合 所 有 集合 的 方法 ( 见 表 2-18)。 
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表 2-18 适合 所 有 集合 的 方法 



























































方法 名 称 操 _ 作 
s.issubset(t) 如 果 s 是 t 的 子 集 ， 则 返回 Trme， 否 则 返回 False 
Ss.issuperset(t) 如 果 s 是 的 超 集 ， 则 返回 True， 和 否则 返回 False 
s.union(t) 返回 一 个 新 集合 ， 该 集合 是 s 和 t 的 并 集 
s.intersection(t) 返回 一 个 新 集合 ， 该 集合 是 s 和 t 的 交集 
s.difference(t) 返回 一 个 新 集合 ， 该 集合 是 s 的 成 员 ， 但 不 是 t 的 成 员 
s.Symmetric_difference(b) 返回 一 个 新 集合 ， 该 集合 是 s 或 t 的 成 员 ， 但 不 是 s 和 t 共 有 的 成 员 
s.copyO 返回 一 个 新 集合 ， 它 是 集合 s 的 浅 拷贝 
例如 : 

>>> s=set('c 

>>> t=set('b 

>>>s 

0 

>>> 七 


测 
>>> s.issubset (t) 

False 

>>> s.issuperset(t 

False 

>>> s.union(t) 

tp :i 'e', be "o's 时 ey 
>>> s.intersection(t) 

ED 

>>> s.difference(t) 

er "ey 

>>> s.symmetric difference(t) 
Mae De 

>>> s.copy() 

a OL 
>>> 


(4) 仅 适 合 可 变 集合 的 方法 ( 见 表 2-19)。 
表 2-19 仅 适 合 可 变 集合 的 方法 





方法 名 称 操 作 





s.update(t) 用 t 中 的 元 素 修改 s， 即 s 现在 包含 s 或 t 的 成 员 





s.intersection update(b) s 中 的 成 员 是 共同 属于 s 和 t 中 的 元 素 





sdifference update(b) s 中 的 成 员 是 属于 s 但 不 包含 在 t 中 的 元 素 


s.symmetric_difference_update(t) | s 中 的 成 员 更 新 为 那些 包含 在 s 或 t 中 ， 但 不 是 s 和 t 共 有 的 元 素 





s.add(obj) 在 集合 s 中 添加 对 象 obj 





s.remove(ob]) 


从 集合 s 中 删除 对 象 obj， 如 果 obj 不 是 集合 s 中 的 元 素 (obj not in 
s)， 将 引发 KeyError 错误 











s.discard(obj) 如 果 obj 是 集合 s 中 的 元 素 ， 从 集合 合 s 中 删除 对 象 obj 
s.popO 删除 集合 s 中 的 任意 一 个 对 象 ， 并 返回 它 
s.clear() 删除 集合 s 中 的 所 有 元 素 


.SN 
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例如 : 


>>> s.update (t) 

>>> S 

{'p', ho 'e', 's', 'o', b', 'k', 'c'} 

>>> s=set('cheeseshop') 

>>> t=set ('bookshop') 

>>> s.intersection update(t) 

>>> S 

{'h', 'p', 's', 'o'} 

>>> s=set('cheeseshop') 

>>> t=set ('bookshop') 

>>> s.difference update(t) 

>>> S 

te 

>>> S=Set('cheeseshop') 

>>> t=Set('bookshop') 

>>> s.symmetric difference update(t) 

>>>s 

(me pe 

>>> s.add('o') 

>>> S 

ED 

>>> s.remove('b') 

>>> S 

freee 

>>> s.remove('a') 

Traceback (most recent call last): 

File "<pyshell#69>", line 1, in <module> 

s.remove('a') 

KeyError: 'a' 


‘a’ 元 素 已 不 在 集合 中 ， 试 图 删除 将 引发 异常 。 又 如 : 
>>> s.discard('a') 
>>> 5 

em or a nen) 
>>> s.discard('e') 
>>> 5 
EO 

>>> s.pop() 

tor 

>>> S 

{'k', ‘cr'} 

>>> s.clear() 

>>> S 

set () 

>>> | 





2.8 正则 表达 式 


首先 须 指出 ， 正 则 表达 式 并 不 是 Python 的 一 部 分 。 正 则 表达 式 是 用 于 处 理 字符 串 的 强 
大 工具 ， 它 拥有 自己 独特 的 语法 以 及 一 个 独立 的 处 理 引 擎 ， 效 率 上 可 能 不 如 str 自 带 的 方 





法 ， 但 功能 十 分 强大 。Python 中 内 建 了 一 个 re 模块 以 支持 正则 表达 式 。 
正则 表达 式 有 两 种 基本 操作 ， 分 别 是 匹配 和 蔡 换 。 


匹配 指 的 是 在 一 个 文本 字符 串 中 搜索 并 匹配 一 个 特殊 表达 式 ， 蔡 换 指 的 是 在 一 个 字符 
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串 中 查找 并 蔡 换 一 个 特殊 表达 式 的 字符 串 
2.8.1 基本 元 素 


正则 表达 式 定义 了 一 系列 的 特殊 字符 元 素 ， 以 执行 匹配 操作 。 表 2-20 列 示 了 正则 表达 
式 的 基本 字符 。 





o 





表 2-20 正则 表达 式 的 基本 字符 


描 述 





匹配 text 字符 串 

匹配 除 换行 符 之 外 的 任意 一 个 单个 字符 
匹配 一 个 字符 串 的 开头 

匹配 一 个 字符 串 的 末尾 


在 正则 表达 式 中 ， 还 可 用 匹配 限定 符 来 约束 匹配 的 次 数 。 表 2-21 列 示 了 正则 表达 式 的 
匹配 限定 符 。 


text 








表 2-21 正则 表达 式 的 匹配 限定 符 


描 述 

重复 匹配 前 表达 式 零 次 或 多 次 
重复 匹配 前 表达 式 一 次 或 多 次 
重复 匹配 前 表达 式 零 次 或 一 次 
精确 重复 匹配 前 表达 式 m 次 
至 少 重复 匹配 前 表达 式 m 次 
至 少 重复 匹配 前 表达 式 m 次 ， 至 多 重复 匹配 前 表达 式 n 次 

由 表 2-20 和 表 2-21 可 知 ，“.*” 为 最 大 匹配 ， 能 匹配 源 字符 串 中 所 有 能 匹配 的 字符 
串 。“.*?” 为 最 小 匹配 ， 只 匹配 第 一 次 出 现 的 字符 串 。 例 如 ，d.*g 能 匹配 任意 以 d 开头 、 
以 g 结尾 的 字符 串 ， 如 “debug” 和 “debugging”， 甚 至 “dog is walking” 都 能 匹配 。 而 d.*?g 只 
能 匹配 “debug”， 在 “dog is walking” 字 符 串 中 ， 则 只 能 匹配 到 “dog”。 

如 果 要 实现 更 为 复杂 的 匹配 ， 可 以 用 组 合 运 算 符 ， 如 表 2-22 所 示 。 
表 2-22 组 合 运算 符 




















组 描 述 
4 | 匹配 集合 内 的 字符 ， 如 [a- 可 、[1.9] 或 [_/ 
[.] | 匹配 除 集合 外 的 所 有 字符 ， 相 当 于 取 反 操作 
AIB | 匹配 表达 式 A 或 B， 相 当 于 or 操作 





表达 式 分 组 ， 每 对 括号 为 一 组 ， 如 ([a-b]+)([A-Z]+)([1-9]+) 








匹配 在 number 表达 式 组 内 的 文本 
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有 一 组 特殊 的 字符 序列 ， 用 来 匹配 具体 的 字符 类 型 或 字符 环境 。 如 \b 匹配 字符 边界 ， 
food\b 匹配 “food”、“zoofood”， 而 与 “foodies” 不 匹配 。 这 些 特殊 的 字符 序列 见 表 2-23。 





表 2-23 ”特殊 字符 序列 











字 符 描 述 
Ww 只 匹配 字符 串 的 开始 

b 匹配 一 个 单词 边界 

B 匹配 一 个 单词 的 非 边界 

yd 匹配 任意 十 进 制 数字 字符 ， 等 价 于 [0-9] 

D 匹配 任意 非 十 进 制 数字 字符 ， 等 价 于 [^0-9] 














Ys 匹配 任意 空白 字符 (空格 符 、Tab 制 表 符 、 换 行 符 、 回 车 、 换 页 符 、 垂 直线 符号 ) 
\S 匹配 任意 非 空白 字符 

Ww 匹配 任意 字母 数字 字符 

WW 匹配 任意 非 字母 数字 字符 

忆 仅 匹 配 字符 串 的 尾部 

\ 匹配 反 斜 线 字符 


在 正则 表达 式 中 ， 还 有 一 套 声明 (assertion)， 可 用 于 对 具体 事件 进行 声明 ， 如 表 2-24 




















所 示 。 
表 2-24 ”正则 表达 式 声明 
声 明 描述 
CiLmsux) | 匹配 空 字符 串 ， 谍 msux 字符 对 应 后 文中 的 正则 表达 式 修饰 符 
(oy 匹配 圆 括号 内 定义 的 表达 式 ， 但 不 填充 字符 组 表 
QP) 匹配 圆 括号 内 定义 的 表达 式 ， 但 匹配 的 表达 式 还 可 用 作 name 标识 的 符号 组 
CP=name) | 匹配 所 有 与 前 面 命名 的 字符 组 相 匹 配 的 文本 
(3#...) 引入 注释 ， 忽 略 圆 括 号 中 的 内 容 
(2=..,) 如 果 所 提供 的 文本 与 下 一 个 正则 表达 式 元 素 匹 配 ， 这 之 间 没 有 多 余 的 文本 就 匹配 。 这 人 允 
许 在 一 个 表达 式 中 进行 超前 操作 ， 而 不 影响 正则 表达 式 其 余部 分 的 分 析 。 如 “Martin" 其 后 
紧 跟 *Brown”， 则 “Martin(?=Brown)” 就 只 与 “Martin" 匹 配 
Mn ] 仅 当 指定 表达 式 与 下 一 个 正则 表达 式 元 素 不 匹配 时 匹配 ， 是 (?=.….) 的 反 操作 
(< 如 果 字 符 串 当前 位 置 的 前 缀 字符 串 是 给 定 文本 ， 就 匹配 ， 整 个 表达 式 就 在 当前 位 置 终 
止 。 如 (?<=abc)def 表达 式 与 abcdef" 匹 配 。 这 种 匹配 是 对 前 组 字符 数量 的 精确 匹配 
Q<1...) 如 果 字 符 串 当 前 位 置 的 前 级 字符 串 不 是 给 定 的 正文 ， 就 匹配 ， 是 (?<=.…) 的 反 操作 





正则 表达 式 还 支持 一 些 修饰 符 ( 见 表 2-25)， 它 会 影响 正则 表达 式 的 执行 方法 。 
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表 2-25 正则 表达 式 的 常用 修饰 符 





于 忽略 表达 式 的 大 小 写 来 匹配 文本 





工 | 根据 当前 语言 环境 解释 单词 。 这 种 解释 影响 字母 组 Ww 和 \W) 以 及 字 边界 行为 (b 和 \B) 
M | 多 行 匹 配 。 就 是 匹配 换行 符 两 端的 潜在 匹配 。 影 响 正则 中 的 ^$ 符 号 
S 
Li 

















| 使 一 个 句点 (C) 匹 配 任何 字符 ， 包 括 换行 符 





根据 Unicode 字符 集 解 释 字母 。 此 标志 影响 w、\W、\b、\B 的 行为 





2.8.2 ”正则 表达 式 的 操作 举例 


通过 Python 内 建 的 re 模块 ， 我 们 就 可 以 在 Python 中 利用 正则 表达 式 对 字符 串 进行 搜 
索 、 抽 取 和 替换 操作 了 。 例 如 ， 使 用 re.search(O) 函 数 能 够 执行 一 个 基本 的 搜索 操作 ， 它 能 
返回 一 个 MatchObject 对 象 ， 使 用 re.findall0 函 数 能 够 返回 一 个 匹配 列表 。 例 如 : 
tC r 


>>> 1 t re 












is 1S my re 
>>> obj = re.search(r 
>>> print (obj) 
<_sre.SRE Match object; span=(0, 7), match='this is'> 
>>> obj .group () 

"this is 

>>> re.findall (r'.*is',a) 

['this is'] 

>>> 


搜索 操作 返回 的 MatchObject 对 象 有 很 多 方法 可 供 使 用 ， 其 功能 如 表 2-26 所 示 。 
表 2-26 MatchObject 对 象 的 常用 方法 











方 法 描 述 
expand(template) 展开 模板 中 用 反 斜 线 定义 的 内 容 
m.group([group,.….]) 返回 匹配 的 文本 ， 是 个 元 组 。 此 文本 是 与 给 定 group 或 由 其 索引 数字 定义 的 组 
匹配 的 文本 ， 如 果 没 有 给 定 组 名 ， 则 返回 所 有 匹配 项 
返回 一 个 元 组 ， 该 元 组 包含 模式 中 与 所 有 组 匹配 的 文本 。 如 果 给 出 default 参 
数 ，default 参数 值 就 是 与 给 定 表达 式 不 匹配 的 组 的 返回 值 。default 参数 的 默认 
取 值 为 None 
m.groupdict([default]) | 返回 一 个 字典 ， 该 字典 包含 匹配 的 所 有 子 组 。 如 果 给 出 default 参数 ， 其 值 就 
是 
返 
返 














m.groups([default]) 

















那些 不 匹配 组 的 返回 值 。default 参数 的 默认 取 值 为 None 









































m.start([group]) 回 指定 group 的 开始 位 置 ， 或 返回 全 部 匹配 的 开始 位 置 

m.end([group]) 回 指定 group 的 结束 位 置 ， 或 返回 全 部 匹配 的 结束 位 置 

m.span([group]) 返回 两 元 素 组 ， 此 元 组 等 价 于 关于 一 给 定 组 或 一 个 完整 匹配 表达 式 的 
(m.start(group), m.end(group))) 列 表 

mpos 传递 给 match0 或 search0 函 数 的 pos 值 

m.endpos 传递 给 match0 或 search0 〇 函数 的 endpos 值 
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续 表 
方 法 描 述 
mre 创建 这 个 MatchObject 对 象 的 正则 式 对 象 
m.string 提供 给 match0 或 searchO 函 数 的 字符 串 





使 用 sub0 或 subn0) 函 数 ， 可 以 在 字符 串 上 执行 替换 操作 。sub0 函 数 的 基本 格式 如 下 : 


sub (pattern, replace, string[,count]) 


举例 如 下 : 

>>> str = 'The 
>>> rep = re.sub( 
>>> print (rep) 
The cat on my bed 
>>> 


其 中 的 replace 参数 可 接受 函数 。 要 获得 蔡 换 的 次 数 ， 可 使 用 subn() 函 数 (基本 格式 同 
sub() 函 数 )， 该 函数 返 回 一 个 元 组 ， 此 元 组 包含 蔡 换 了 的 文本 及 蔡 换 的 次 数 。 例 如 : 


So Er 芭 
>>> rep = re. i 
>>> print (rep) 
('The cat on my bed', 1) 
>>> | 


若 需 要 用 同一 个 正则 式 进 行 多 次 匹配 操作 ， 则 可 以 把 正则 表达 式 编译 成 内 部 语言 ， 这 
样 可 以 提高 处 理 速度 。 编 译 正则 表达 式 使 用 compile(0) 函 数 ， 其 基本 格式 为 : 
compile(str[, flags]) 
其 中 ，str 表示 需要 编译 的 正则 表达 式 串 ，flags 是 一 个 修饰 标志 符 。 正 则 表达 式 被 编 
译 后 生成 一 个 对 象 ， 该 对 象 拥 有 多 种 方法 和 属性 ， 如 表 2-27 所 示 。 
表 2-27 正则 表达 式 编译 后 对 象 的 方法 /属性 











Str) 


g, 





方法 /属性 
r.search(string[,pos[,.endpos]]) 


描 述 
同 search0 函 数 ， 但 此 函数 允许 指定 搜索 的 起 点 和 终点 


r.match(string[,pos[,endpos]]) 同 match0 函 数 ， 但 此 函数 允许 指定 搜索 的 起 点 和 终点 























r.split(string[,max]) 同 split0 函 数 

r.findall(string) 同 findall0 函 数 

r.sub(replace,string[,count]) 同 sub0 函 数 

.subn(replace,string[,count]) 同 subn0 函 数 

r.flags 创建 对 象 时 定义 的 标志 

Ir.groupindex 将 r“(?Pid)* 定 义 的 符号 组 名 字 映 射 为 组 序号 的 字典 
r.pattern 在 创建 对 象 时 使 用 的 模式 


有 两 个 函数 在 此 值得 一 提 ， 一 是 re.escape(0) 函 数 ， 二 是 re.getattr() 函 数 。 
1.，re.escape() 函 数 用 于 转 义 字符 串 
在 使 用 Python 的 过 程 中 ， 对 转 义 字符 的 使 用 也 有 苦恼 之 时 。 因 为 有 时 候 我 们 需要 使 用 
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一 些 特殊 符号 ， 如“$ * . ^” 等 的 原意 ， 有 时 候 需 要 的 是 被 转 义 后 的 功能 ， 并 且 转 义 字符 
的 使 用 很 繁琐 时 ， 很 容易 出 错 ，re.escape0 是 解决 这 一 问题 的 灵丹妙药 。 

Te.escape(pattern) 可 以 对 字符 串 中 所 有 可 能 被 解释 为 正则 运算 符 的 字符 进行 转 义 。 如 果 
字符 串 很 长 ， 且 包含 很 多 特殊 字符 ， 而 又 不 想 输 入 一 大 堆 反 斜 枉 ， 或 者 字符 串 来 自 于 用 户 
(比如 通过 input 函数 获取 输入 的 内 容 )， 且 要 用 作 正 则 表达 式 的 一 部 分 的 时 候 ， 就 可 以 使 用 
这 个 函数 。 

现 举 一 例 说 明之 : 

>>> re.escape('www.python.org') 

'WWww\\ .python\\.org" 

>>> re.findall (re.escape('Ww.py'),"jw.pyji w.py.f") 
['w.py', 'w.py'] 

>>> | 


这 里 的 re.escape(“w.py”) 用 作 re.findall0 函 数 的 正则 表达 式 部 分 。 
2.，re.getattr() 函 数 用 于 获取 对 象 的 引用 
现 举例 说 明 如 下 : 


>>> li=['a', 'b'] 
>>> getattr (1i, 'append') 
<built-in method append of list object at 0x02508F58> 
>>> getattr (1i, 'append') ('c') # 相 当 于 1i1.append('c') 
>>> 1i 
['a', 'b', 'c'] 
>>> handler=getattr (1i, 'append' ,None) 
>>> handler 
<built-in method append of list object at 0x02508F58> 
>>> handler('cc') # 相 当 于 1i .append('cc') 
>>> 1i 
[aa ，"b"，"c"， "cc'] 
>>> result = handler('bb') 
>>> 1i 
an br en co bb] 
>>> print (result) 
None 
>>> 





2.8.3 ”正则 表达 式 测 试 工具 


按照 特定 需求 编写 的 正则 表达 式 到 底 正确 与 否 ， 初 学 者 往往 拿捏 不 准 ， 因 此 ，“ 正 则 
表达 式 测试 工具 ”应 运 而 生 ， 它 为 程序 员 编 写 正则 表达 式 带 来 了 极 大 的 方便 ， 不 仅 能 帮助 
程序 员 编 写 需要 的 正则 表达 式 ， 还 可 以 使 用 它 理解 别人 编写 的 表达 式 。 

目前 ， 正 则 表达 式 测试 工具 软件 非常 多 ， 如 RegexBuddy、RegexMagic、Regex Match 
Tracer、RegexTester 等 。 因 篇 幅 所 限 ， 本 小 节 仅 介绍 一 款 免费 的 国产 正则 表达 式 工具 软件 
Regex Match Tracer， 简称 Match Tracer。 

Match Tracer 是 一 款 用 来 编写 和 调试 正则 表达 式 的 工具 软件 ， 通 过 其 可 视 化 的 界面 ， 
我 们 可 以 快速 、 正 确 地 写 出 复杂 的 正则 表达 式 。 

图 2-1 是 Match Tracer 启动 后 的 界面 。 
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[号 二 -Regex Match Tracer 3 eae 圳 | 
文件 日 “编辑 (日 查看) 匹配 (V) 功能 (M) 工具 (帮助 (H) 
口中 加 | 关 苇 外 | 之 全 | M 4 》hM | 各 | 里 | 「 查 护 区 本 ”。 普 换 模式 | 分 草 模 式 | ”优化 模式 
厂 忽略 大 小 写 。 厂 单行 模式 厂 多 行 模式 厂 全 局 模式 厂 从 右 向 左 ” 厂 扩展 模式 | 
匹配 ”| “全 部 区 配 | ”匹配 重 轩 | 厂 仅 测试 当前 元 素 
文本 片段 














”| 分 组 [命名 | 捕获 内 容 
$0 





























就 绪 第 0 个 共 0 个 | 
L | 








2-1 Match Tracer 界面 


该 软件 的 主要 功能 如 下 。 


0) 
© 
而 不 乱 。 
G) 
加 
(9 
向 有 ”、 
(OO 
0 
(8 
O) 


行 相互 拖 动 。 


以 语法 着 色 形 式 显示 表达 式 ， 使 正则 表达 式 便 于 阅读 。 
采用 树 和 分 组 列表 ， 同 步 显示 正则 表达 式 的 结构 ， 使 复杂 的 表达 式 一 目 了 然 、 长 


详细 记录 每 一 个 匹配 结果 ， 包 含 分 组 结果 以 及 匹配 所 花 时 间 。 

本 进行 “匹配 ”、“ 蔡 换 ”、“ 分 割 ”功能 的 正则 表达 式 应 用 测试 。 

[进行 “忽略 大 小 写 ”、“ 单 行 模式 ”、“ 多 行 模式 ”、“ 全 局 模式 ”、“ 从 左 
“扩展 模式 ”等 模式 下 的 正则 表达 式 测试 。 

[单独 测试 表达 式 中 的 一 部 分 ， 有 利于 分 段 调试 复杂 的 正则 表达 式 。 

J 以 设置 一 个 匹配 起 始点 ， 方 便 排 查 表达 式 错误 。 

支持 高 级 正则 语法 ， 例 如 递归 匹配 等 。 

可 以 保存 文本 片段 ， 例 如 表达 式 或 者 其 他 文本 ， 也 可 以 跟 任 意 其 他 编辑 器 之 间 进 


| 局 


四 


= 可 





(10) 可 以 将 当前 表达 式 保存 为 一 个 “快照 ”， 使 用 户 放心 地 改写 表达 式 。 

(11) 强调 编写 “复杂 ”的 正则 表达 式 。 

一 个 完善 的 表达 式 往往 都 是 比较 复杂 的 ， 比 如 分 析 HTML 的 表达 式 。 但 是 ， 复 杂 的 表 
达 式 并 不 意味 着 低 效 ， 相 反 ， 因 为 复杂 的 表达 式 考虑 得 比较 周全 ， 所 以 匹配 效率 反而 更 
高 。Match Tracer 正 是 针对 这 种 情况 ， 着 重 考虑 如 何 协助 编写 复杂 而 周全 的 表达 式 。 

该 软件 可 将 测试 好 的 表达 式 直 接 导 出 为 程序 语言 代码 ， 也 可 以 直接 从 程序 源 代 码 的 字 
符 串 中 导入 表达 式 ， 支 持 匹 配 结果 、 蔡 换 结果 、 分 割 结果 的 导出 ， 整 个 表达 式 测 试 环 境 可 
以 另存 为 一 个 项 目 。 

下 面 详细 介绍 该 软件 的 最 常用 功能 。 
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1. 查找 匹配 


“查找 匹配 ”界面 适合 用 来 进行 一 般 的 正则 表达 式 匹 配 测试 。 如 图 2-2 所 示 ， 界 面 中 
间 有 两 个 编辑 框 ， 上 面 的 编辑 框 用 于 输入 正则 表达 式 ， 下 面 的 编辑 框 用 于 显示 匹配 的 文 
本 ; 界面 左 侧 中 部 是 一 个 显示 正则 表达 式 结构 的 树 结构 控件 ， 界 面 下 方 是 一 个 列举 正则 表 
达 式 捕获 组 的 列表 框 。 






















































































晤 天 是 -Regex Match Tracer ee) 
文件 昌 ” 编 如 查看 WV) 匹配 (M) 功能 (M) 工具 (帮助 (H) 
D 世 晶 |* 守 久 | 守 全 | +》 | 关 | 全 | 「 覃 我 区 本 _ 首 换 模式 | 分 市 模式 | _ 优 化 模式 
| 厂 忽略 大 小 写 。 厂 单行 模式 厂 多 行 模式 厂 全 局 模式 “三 从 右 向 左 。 厂 扩展 模式 
| 一 匹配 “| “全 部 匹配 | 。 匹 尼 重 夏 | 三 仅 测 工 当前 元 素 
— wi 
日 捕 正 组 () 
由 仙 杏 模式 重复 
[上 
将 文本 拖 至 此 处 
为 组 | 帝 各 | 擅 区 内容 
$0 
$1 
| 
| 
就 绪 荫 0 个 共 0 个 | | | A 
= | 

















图 2-2 “查找 匹配 ”界面 


(1) 正则 表达 式 输入 框 。 

在 正则 表达 式 输入 框 内 输入 表达 式 时 ， 表 达 式 文本 将 根据 表达 式 的 语法 自动 进行 着 
色 。 随 着 正则 表达 式 的 输入 ， 正 则 表达 式 结构 框 和 捕获 组 列表 框 会 同步 显示 。 当 输入 光标 
在 编辑 框 中 移动 时 ， 光 标 所 在 位 置 的 当前 表达 式 元 素 会 突出 显示 。 在 表达 式 输入 框 中 双击 
鼠标 ， 鼠 标 所 在 位 置 的 当前 元 素 会 被 选中 。 

(2) 匹配 文本 编辑 框 。 

编辑 文本 ， 用 于 测试 正则 表达 式 。 

(3) 表达 式 树 结构 框 。 

在 表达 式 输入 框 中 输入 表达 式 时 ， 树 结构 会 同步 更 新 。 当 输入 光标 在 输入 框 中 移动 
时 ， 树 结构 中 相应 的 节点 会 被 选中 。 点 击 树 结构 中 的 节点 ， 表 达 式 框 中 相应 的 元 素 会 被 选 
中 。 双 击 树 结构 框 ， 表 达 式 输入 框 将 会 获得 输入 焦点 。 

(4) 捕获 组 列表 框 。 

在 输入 框 中 输入 表达 式 时 ， 捕 获 组 框 会 同步 更 新 ， 列 举 当 前 表达 式 中 的 捕获 组 。 点 击 
捕获 组 列表 框 ， 匹 配 文本 编辑 框 中 的 相应 文本 会 被 选中 。 双 击 捕获 组 列表 框 ， 表 达 式 输入 
框 将 会 获得 输入 焦点 ， 如 图 2-3 所 示 。 


2. 替换 模式 
“替换 模式 ”与 “匹配 模式 ” 相 比 ， 增 加 了 “替换 为 ”输入 框 和 蔡 换 结果 框 ， 如 图 2-4 
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所 示 。 
辐 无 标题 - Regex Match Tracer rr LE zs 
文件 昌 编辑 (9 查看 MV) 92(M) 功能 (M) 工具 (D 帮助 () 
口 蕊 日 |% 时 入 | 喇 全 | 4 上 是 | 钨 | 时 || 「 村 我 区 配音 换 模式 | 。 分 类 模式 | 。 优化 模式 
厂 忽略 大 小 写 。 厂 单行 模式 厂 多 行 模式 厂 全 局 模式 ”三 从 右 向 左 “三 扩展 模式 | 
匹配 “| 全 部 区 配 | 厂 仅 测 试 当前 元 素 
[wr VT 
日 银 人 整体 | 
日 国定 重复 
得 捷 区 组 (1) 
旦 组 合 整 体 | 
拍 贫 禁 楼 式 重复 | 
字符 范围 | 
es | | 
日 人 要 模式 重复 IE Ht 外) | 
字符 范围 | 
分 得 [命名 | 搞 区 内容 
$0 
$1 
| 回 英 少 ”人 双 次 站 
图 2-3 双击 捕获 组 列表 杠 
咖 无 标题 - Regex Match Tracer 本 二 
文件 昌 ”编辑 () 查看 VV) 匹配 (M) 功能 (M) 工具 (D 帮助 (H) 
DD 中 日 | 各 攀 | 吕 全 | 1 ) MM| 锦 | 时 | 查找 匹配 | [车 损 模式 ”分 齐 模 式 | 优化 模式 
| 厂 忽略 大 小 写 。 厂 单行 模式 三 多 行 模式 厂 全 局 模式 厂 从 右 向 左 。” 厂 扩展 模式 | 
| ER 全 部 匹配 配 重 加 | 。 厂 仅 测试 当前 元 素 | 
x |(\w+) | 
WR | 
由 俩 禁 模 式 重复 
| 
加 [ 
ET | pe 
| 
[分组 命名 | 捕获 内 容 
$0 
$1 
| 
Em _[ 攻 OfREOF | 4 

















图 2-4 “替换 模式 ”界面 


图 中 写 着 “$1 ”字样 的 编辑 框 为 “替换 为 ”输入 框 。 再 往 下 的 两 个 分 隔 开 的 编辑 杠 


中 ， 左 边 一 个 是 匹配 文本 输入 框 ， 右 边 一 个 是 蔡 换 结果 框 。 蔡 换 结 果 框 为 只 读 编辑 框 ， 因 
为 是 替换 的 结果 ， 因 此 其 中 的 内 容 不 可 再 次 编辑 。 


(1) “替换 为 ”输入 框 。 


在 “替换 为 ”输入 框 中 输入 时 ， 以 “$* 开 始 的 特殊 符号 会 采用 突出 颜色 显示 。 输 入 光标 
在 “替换 为 ” 框 中 移动 时 ， 匹 配 文本 框 和 结果 框 中 对 应 的 文本 会 被 选中 。 
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#2 in 


(2) 蔡 换 结果 框 。 

点 击 “匹配 ” 按 钮 或 者 “全 部 匹配 ”按钮 时 ， 蔡 换 结果 会 显示 在 替换 结果 框 。 输 入 光 
标 在 蔡 换 结果 框 中 移动 时 ， 匹 配 文本 框 和 “ 蔡 换 为 ”输入 框 中 对 应 的 文本 会 被 选中 ， 实 际 
运行 效果 如 图 2-5 所 示 。 可 见 ， 待 匹配 文本 中 的 网 址 都 被 统一 替换 为 目标 字段 。 











[8 5- Regex Match Tracer eel ex) 
文件 ( 昌 编辑 (E) 查看) 匹配 (M) 功能 (M) 工具 (D 帮助 (H) 
DD 成 日 |%* 凤 攀 | 裕 全 |K 《4M | 和 | 时 | 查找 区 配 | 「 管 扫 模 式 分 市 模式 | 。 优化 模式 
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匹配 全 部 匹配 匹配 重 | ”三 仅 测试 当前 元 素 
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2-5 ”替换 模式 实际 运行 效果 
3. 文件 菜单 
文件 菜单 负责 “正则 表达 式 项 目 ” 的 新 建 、 打 开 和 保存 。 正 在 进行 编辑 和 测试 的 正则 


表达 式 、 匹 配 文本 以 及 相关 的 其 他 参数 ， 可 以 一 起 作为 一 个 “正则 表达 式 项 目 ” 保 存 到 一 
个 文件 中 ， 下 次 打开 后 可 继续 进行 编辑 和 测试 。 


2.8.4 正则 表达 式 的 在 线 测试 


如 果 读者 在 实际 写 正则 表达 式 的 时 候 ， 对 匹配 范围 掌控 不 好 ， 可 以 在 正则 表达 式 测 试 
网 站 http://tool.chinaz.com/regex/ 上 修改 正则 匹配 规则 ， 通 过 这 个 正则 测试 网 站 ， 可 以 清晰 
地 看 到 匹配 的 内 容 。 

此 外 ， 对 于 一 些 常用 的 正则 表达 式 ， 如 中 文字 符 、 双 字 节 字符 、 空 白 行 、E-mail 地 
址 、 网 址 、URL、 手 机 号 码 (国内 )、 电 话 号 码 (国内 )、 正 浮 点 数 、 负 浮 点 数 、 整 数 、 腾 讯 
QQ 号 、 邮 政 编码 、IP、 身 份 证 号 、 格 式 日 期 、 正 整数 、 负 整数 、 用 户 名 等 ， 该 网 站 均 直 
接 给 出 ， 大 大 方便 了 使 用 者 。 
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本 章 小 结 


作为 Python 语言 基础 中 的 基础 ， 本 章 介绍 了 Python 的 基本 语法 与 句法 ， 包 括 标识 
符 、 注 释 符 、 换 行 符 、 续 行 符 等 ， 介 绍 了 代码 块 的 概念 及 其 表达 方式 ， 强 调 了 Python 文件 
的 模块 化 组 织 方 式 ; 介绍 了 Python 语言 的 基本 数据 类 型 ， 包 括 数 值 、 字 符 串 、 列 表 、 元 
组 、 字 典 、 集 合 ; 介绍 了 赋值 的 概念 ， 介 绍 了 序列 的 概念 及 其 基本 操作 ， 包 括 索引 、 切 
片 、 加 、 乘 、 检 查 成 员 等 ， 介绍 了 字符 串 、 列 表 、 元 组 、 字 典 、 集 合 中 大 量 的 函数 ( 方 
法 ); 最 后 介绍 了 正则 表达 式 的 概念 及 应 用 。 


习 题 





1. 填空 题 

(1) Python 的 注释 语句 以 ( ) 字 符 开始 。 

(2) Python 的 相 邻 语句 使 用 换行 ( 回 车 ) 分 隔 ， 亦 即 一 行 一 条 语句 。 如 果 一 行 语句 过 
长 ， 可 以 使 用 续 行 符 ( ) 分 解 为 多 行 。 

(3) Python 允许 将 多 个 语句 写 在 同一 行 上 ， 语 句 之 间 用 ( ) 隔 开 。 

(4) Python 中 代码 组 以 不 同 的 ( ) 分 隔 。 

(5) Python 支持 复数 ， 可 以 表示 为 atbj 或 者 ( 于 

(6) 运算 符 的 优先 级 决定 了 运算 顺序 ， 例 如 ，2*2**3 的 结果 是 ( )，2**3/2 的 结 


果 是 ( 六 

(7) 设 有 sl = set(‘hello’), s2 = set('world)， 则 sl & s2 的 结果 是 ( )，sl1 | s2 的 结 
果 是 ( )，s] - s2 的 结果 是 ( )，s1^s2 的 结果 是 ( 其 

(8) 设 有 字符 串 strl = “Hello ’, str2 =“world'， 则 strl+str2 的 结果 是 ( )，strl*2 
的 结果 是 ( x 


(9) 当 在 多 个 正则 表达 式 方法 中 使 用 同一 匹配 模式 时 ， 可 以 通过 ( ) 函 数 将 匹配 
模式 编译 成 内 部 语言 ， 以 提高 处 理 速度 。 
(10) 设 字典 dictl = 《addr… 天 津 ”， name”: Bob，'addr:… 北 京 ， 则 语句 print(dictl 


['addr]) 的 结果 是 ( 六 

2. 选择 题 

(1) 哪 一 个 不 是 Python 语言 的 基本 结构 > (  ) 
A. 链表 B. 元 组 C. 字典 D. 集合 

(2) 那 一 个 不 属于 Python 的 序列 类 型 ?(  ) 
A. 字符 串 B. 列表 C. 集合 D. 元 组 

(3) /和 // 都 是 Python 的 除法 运算 ，6/3 的 结果 是 ( 。”)，6//3 的 结果 是 ( 。 )。 
并 .这 B.3 人 20 D.0 

(4) 以 下 哪个 变量 的 命名 不 正确 ? ( ) 
A. mm 123 B. mml23 C.123 mm D. mm 123 
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(5) type(1+2*3.14) 的 结果 是 (  )。 


A. <type “int*> B. <type ‘float> 

C. <type ‘str’> D. <type ‘complex’> 
(6) 有 字符 串 str=‘abcdefeg*"， 那 么 str[:-4:-2] 的 结果 是 (。”)。 

A.'‘ac’ B. ‘ge” Co D. ‘eg’ 
(7) 执行 下 面 的 操作 后 ，list2 的 值 是 (  )。 

而 SEE [a,.5,6] 

list2 = listl 

listi[2] = 3 

A. [4,5,6] B. [4,3.6] C. [4,5,3] D. 以 上 都 不 正确 
(8) 关于 Python 中 的 变量 ， 下 列 说 法 错误 的 是 ( )。 

A. 变量 不 必 事 先 声明 B. 变量 须 先 定义 后 使 用 

C. 对 象 无 须 指定 类 型 D. 可 以 使 用 del 释放 变量 
(9) 哪 一 个 数据 类 型 不 可 以 作为 字典 的 键 ? (  ) 

A. 字符 串 B. 数字 C. 元 组 D. 列表 
(10) 下 列 哪 种 不 属于 集合 的 操作 ? (  ) 

A.& B.| CE D.- 
3. 问答 题 


(1) 表 中 工 有 相同 的 元 素 ， 如 何 用 最 简单 的 方法 去 除 之 ? 

(2) 以 下 列 三 种 方式 打印 字符 囊 <Bob said “T m OK”>。 

GD print(r‘Bob said “IYm OK 

@ print(r‘Bob said“T m OK 

@ print(‘Bob said “I m OK”) 

问 : 哪 种 打印 方式 是 正确 的 ? 不 正确 的 打印 方式 的 错误 原因 是 什么 ? 

(3) 对 元 组 tup = (1,2,[3,4],“567”) 进 行 以 下 操作 。 

中 tup[0]=8 

四 tup[2][0] =8 

®@ tup[3][0] =8 

@ tup[2]= [8.9] 

问 : 上 述 哪些 操作 是 正确 的 ， 请 说 明理 由 。 

(4) 有 如 下 字符 囊 定义 : 

n= es 

str2 = strl.replace('a', 'A') 

问 : id(strl) 是 否 等 于 id(str2)? 请 说 明理 由 。 

4. 实验 操作 是 

(1) 列表 names = ['Dave',['Mark Ann] Phil. Tom"]， 根 据 以 下 要 求 ， 写 出 相应 的 列 
表 操 作 。 


(6s. 


mm Python 程序 设计 实用 教程 


获取 元 素 “Mark”。 

将 元 素 ‘Phil" 换 成 Jeff 。 

获取 列表 的 长 度 。 

向 列表 末尾 添加 “有 Kate" 元 素 。 

移 除 列表 中 的 ‘Ann’ 元 素 。 

将 ‘Sydney ”插入 到 列表 下 标 为 2 的 位 置 。 
分 别 获取 列表 的 前 两 个 元 素 和 后 两 个 元 素 。 
(2) 写 出 下 列 各 条 命令 的 执行 结果 : 

nEO ESEo0d =" Ea02"w 相 E00" 
print (info) 

print (info["stu01"]) 

print (info.get ("stu04")) 

print ("stu03" in info) 

info["stu02"] = " 李 四 四 " 

print (info) 

info["stu04"] = " 赵 六 " 

print (info) 

del info["stu04"] 

info.pop ("stu03") 

Print (info) 

(3) 根据 要 求 写 出 相应 的 正则 表达 式 。 
匹配 正 整 数 。 

匹配 负 整数 。 

匹配 整数 。 

匹配 由 26 个 大 写 英文 字母 组 成 的 字符 串 。 
匹配 由 26 个 小 写 英文 字母 组 成 的 字符 串 。 
匹配 由 26 个 英文 字母 组 成 的 字符 串 。 
匹配 由 数字 和 26 个 英文 字母 组 成 的 字符 串 。 
匹配 中 国 邮政 编码 。 

匹配 身份 证 (15 位 或 18 位 )。 


QA@Q@EOO@OOO 


OO@AQA@@GOO@OOO 


ess, 
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本 章 要 点 

(1) 这 语句 的 基本 格式 及 执行 规则 。 

(2) 让 语句 诺 套 的 使 用 方法 。 

(3) for 语 和 句 的 基本 格式 及 执行 规则 。 

(4) for 语 和 句 循环 谋 套 的 使 用 方法 。 

(5) rangeO 函 数 在 循环 中 的 使 用 。 

(6) while 语句 的 基本 格式 及 执行 规则 。 

(7) while 语句 循环 谋 套 的 使 用 方法 。 

(8) break、continue、pass 等 关键 字 在 循环 中 的 使 用 方法 。 

学 习 目 标 

(1) 理解 选择 结构 和 循环 结构 的 执行 过 程 。 

(2) 掌握 选择 结构 和 循环 结构 的 编程 方法 。 

(3) 理解 循环 谋 套 的 执行 过 程 。 

(4) 运用 流程 控制 编程 解决 一 些 实际 问题 。 

本 章 将 详细 介绍 在 Python 中 如 何 实现 选择 结构 ， 即 根据 特定 的 条 件 执行 或 不 执行 某 些 
语句 。 本 章 还 将 介绍 循环 结构 ， 即 根据 特定 的 条 件 多 次 执行 某 些 语句 。 本 章 的 诸多 示例 程 
序 表明 ， 程 序 中 只 有 使 用 选择 结构 和 循环 结构 ， 才 能 充分 挖掘 和 利用 计算 机 的 功能 ， 从 而 
编写 程序 完成 各 种 各 样 的 任务 。 


3.1 ji 语句 


让 语句 的 基本 内 容 包 括 辽 、if-else、if-elif-else、 三 元 运算 符 、 比 较 运 算 符 等 。 

Python 3 的 条 件 语 句 通过 测试 某 个 条 件 是 否 成 立 (True 或 者 False、 真 值 或 者 假 值 、0 或 
者 1) 来 决定 执行 的 代码 块 。if 后 面 的 条 件 可 以 是 一 个 ， 也 可 以 是 多 个 。 多 个 条 件 通过 布尔 
操作 符 and( 与 )、or( 或 )、not( 非 ) 进 行 组 合 ， 形 成 条 件 表达 式 。 

单个 条 件 站 语句 的 执行 过 程 如 图 3-1 所 示 。 


3.1.1 ji 语句 
Python 中 ， 让 语句 的 一 般 形 式 为 : 


if condition 1: 
statements 1 


其 执行 过 程 是 ， 如 果 condition 1 为 True， 则 执行 statements_1 语句 块 (代码 块 )。 

该 站 语句 由 三 部 分 组 成 : 关键 字 、 判 断 结果 真 假 的 条 件 表 达 式 ， 以 及 当 表 达 式 为 真 时 
执行 的 代码 块 。 

代码 块 是 条 件 为 真 时 执行 的 一 组 代码 ， 在 代码 前 放置 空格 来 缩 进 语句 ， 即 可 创建 代码 
块 。 前 已 提 及 ，Python 要 求 严格 缩 进 ， 不 能 第 一 次 使 用 Tab 键 缩 进 ， 第 二 次 使 用 空格 键 缩 
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进 ， 而 要 做 到 缩 进 方式 的 统一 。 另 外 ， 在 集成 开发 环境 中 ， 缩 进 是 自动 完成 的 ， 换 句 话 
说 ， 键 入 冒号 () 并 按 Enter 键 后 ， 下 一 行 一 般 将 自动 缩 进 四 个 空格 。 




















3-1 j 首 语 句 的 控制 流程 


【 例 3-1)】 简单 的 站 语句 : 


varl = S50 
if varl: 


print ("if-1 表达 式 条 件 为 true 或 1") 


print (varl) 


WAT2.= 0 

if var2: 
print ("if-2 表达 式 条 件 为 true 或 1") 
print (var2) 

print ("Good bye!") 

执行 以 上 代码 ， 输 出 结果 为 : 

if-1 表 达 式 条 件 为 true 或 1 

50 

Good pye! 

3 


从 结果 可 以 看 到 ， 由 于 变量 var2 为 0， 所 以 对 应 的 庄内 的 语句 块 没有 执行 。 


站 注意 : 
@ ”在 每 个 条 件 表 达 式 的 后 面 都 要 使 用 冒号 (:)， 表 示 接 下 来 是 满足 条 件 后 要 执行 的 语 
句 块 。 
@ ”在 Python 中 ， 没 有 类 似 于 C 语言 的 Switch-case 语句 。 
@ 标准 值 False 和 None、 所 有 类 型 的 数字 0( 浮 点 型 、 长 整 型 和 其 他 类 型 )、 空 序列 
( 空 字符 串 、 空 的 元 组 和 列表 及 字典 等 ) 都 为 假 或 者 0。 
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@ ”让 语 句 块 如 果 仅 有 一 条 语句 ， 则 可 以 与 让 语句 写 在 同一 行 上 ， 但 “:” 不 能 省 略 。 
3.1.2 if-else 语句 
Python 中 ，if-else 语句 的 一 般 形式 如 下 : 


if condition 1: 
statements 1 

else: 
statements 2 


其 执行 过 程 是 : 

如 果 condition_1 为 True， 则 执行 statements_1 语句 块 。 
如 果 condition_1 为 False， 则 执行 statements 2 语句 块 。 
其 中 ，else 子 句 是 可 选 的 。 

【 例 3-2】 根据 输入 的 年 龄 判断 是 否 为 成 年 人 : 

age = int (input ("请 输入 你 的 周岁 年 龄 : ") ) 


下 GE 
if age < 18: 

print ("你 是 未 成 年 人 ") 
else: 


print ("你 是 成 年 人 ") 


执行 以 上 代码 ， 运 行程 序 两 次 ， 输 出 结果 为 : 
请 输入 你 的 周岁 年 龄 : 17 


>>> 


请 输入 你 的 周岁 年 龄 : 18 
你 是 成 年 人 


>>> 
千 注意 : inputO 函 数 用 于 从 键盘 接收 输入 的 内 容 ，intO 函 数 用 于 把 输入 的 内 容 转 换 为 整 
数 。 这 些 都 是 内 建 函 数 ， 可 以 直接 使 用 ， 不 需要 使 用 第 4 章 要 介绍 的 import 
语句 导入 相应 模块 。 


3.1.3 ”if-elif-else 语句 
Python 中 ，if-elif-else 语句 的 一 般 形 式 如 下 : 


if condition 1: 
statements 1 

elif condition 2: 
statements 2 

else: 
statements 3 
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其 执行 过 程 是 : 
如 果 condition 1 为 True， 则 执行 statements ] 语句 块 。 
如 果 condition 1 为 False， 则 判断 condition 2。 
如 果 condition 2 为 True， 则 执行 statements 2 语句 块 。 
如 果 condition 2 为 False， 则 执行 statements 3 语句 块 。 
Python 中 用 elif 代 蔡 了 else i 所 以 站 语句 的 关键 字 为 下 elif-else。 跟 else 一 样 ，elif 
子 句 是 可 选 的 ， 然 而 不 同 的 是 ， 站 f 语句 可 以 有 任意 数量 的 elif 子 句 ， 但 最 多 只 能 有 一 个 
else 子 句 。 
【 例 3-3】 根 据 动物 的 年 龄 ， 计 算 对 应 于 人 类 的 年 龄 : 
age = int (input (" 请 输入 狗 的 年 龄 : ") ) 
PrinE( sy 
if age < 0: 
print ("请 输入 正确 的 年 龄 1") 
elif age == 1: 
print ("相当 于 14 岁 的 人 。") 
elif age == 2: 
print ("相当 于 22 岁 的 人 。") 
elif age > 2: 
human = 22 + (age -2)*5 
print ("对 应 人 的 年 龄 : "，human) 
执行 以 上 代码 ， 输 出 结果 为 : 
请 输入 狗 的 年 龄 : 8 
对 应 人 的 年 龄 : ”52 


>>> 
3.1.4 三 元 运算 符 
Python 三 元 运算 符 的 语法 为 : 


X if C else Y 


其 中 C 是 条 件 表达 式 ，X 是 C 为 True 时 的 结果 ，Y 是 C 为 False 时 的 结果 。 有 了 三 
元 运算 符 后 ， 只 需要 一 行 ， 就 可 以 完成 条 件 判断 和 赋值 操作 。 

【 例 3-4】 三 元 运算 符 的 应 用 : 

= 0 

bigger = x if x > y elsey 

print (bigger) 

执行 以 上 代码 ， 输 出 结果 为 : 


8 
E> 


也 可 以 用 正常 的 直 else 语句 完成 上 述 功 能 ， 代 码 如 下 : 


> 
he 
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bigger = x 
else: 
bigger = Y 
print (bigger) 
， 使 用 三 元 运算 符 能 让 程序 更 加 简洁 、 紧 凑 。 


3.1.5 ”比较 操作 符 


第 2 章 介绍 运算 符 时 ， 已 在 表 2-1 中 罗列 了 Python 的 比较 操作 符 。 为 


单独 将 比较 操作 符 列 于 表 3-1 中 。 








表 3-1 比较 操作 符 及 其 意义 

比较 操作 符 比较 操作 符 的 含义 
< 小 于 例 : 2<3_ 值 为 Tme 
= 小 于 或 等 于 例 : 4<=4 值 为 True 
> 大 于 例 : 9>7 值 为 Tue 
es 大 于 或 等 于 例 : 9>=9 值 为 True 
一 ， 比 较 对 象 是 否 相等 例 : 5 一 5_ 值 为 True 
= 二 例 : 5!=4_ 值 为 Tme 
is aisb a_ 和 b 是 同一 个 对 象 
is not ais notb a 和 b 不 是 同一 对 象 
in ainb a 是 b 容器 中 的 元 素 
not in anotinb a 不 是 b 容器 中 的 元 素 

下 面 我 们 看 几 个 例子 。 

【 例 3-5】“ 一 ”操作 符 的 功能 

# 使 用 常量 

print (5 == 7) 

# 使 用 变量 

入 -三 海 

二 

print (x == Y) 

执行 以 上 代码 ， 输 出 结果 为 

False 

True 

>>> 


【 例 3-6】 演 示 猜 数字 功能 


x = int (input ("请 输入 数字 : 
人 

print("' 人 0') 
elif x == 

Beant a ) 
elif x == 1: 
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")) 


3<1 值 为 False 
4<=1 值 为 False 
7>8 值 为 False 
7>=8 值 为 False 
4==8 值 为 False 
4!=4 值 为 False 


第 3 章 ”Python 沪 各 拉 促 人 


Print (' 输 入 的 数字 为 1') 
else: 


print (' 输 入 的 数字 大 于 等 于 2' ) 


执行 以 上 代码 4 次 ， 输 出 结果 分 别 为 : 
请 输入 数字 : 5 
输入 的 数字 大 于 等 于 2 


>>> ============ 一 
请 输入 数字 : -1 
>>> ======-==—= 一 


请 输入 数字 : 1 
输入 的 数字 为 1 

>>> ============= 
>>> 

请 输入 数字 : 0 
输入 的 数字 为 0 

22 浊 | 


【 例 3-7】 判 断 列表 是 否 相 等 : 


a=c= [1,2] 
b =[1,2] 

print (a==c) 
print (a==b) 
print (a is c) 
print (a is b) 


执行 以 上 代码 ， 输 出 结果 为 : 
True 

True 

True 

False 

>>> 


还 注意 : 此 程序 说 明 a 和 b 值 相 等 ， 但 不 是 同一 个 对 象 。 
【 例 3-8】 字 符 串 应 用 : 


= “bello” 
4 
print ("yes") 
SESe. 
print ("no") 


执行 以 上 代码 ， 输 出 结果 为 : 
yes| 
>>> 


3.1.6 if 衬 套 


在 嵌 套 的 站 语句 中 ， 可 以 把 felif-else 结构 放 在 另外 一 个 下 elif-else 结构 中 。 一 般 形 
式 如 下 : 
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if condition 1: 
statements 1 
if condition 2: 
statements 2 
elif condition 3: 
statements 3 
else 
statements 4 
elif condition 4: 
statements 5 
Slses 
statements 6 


【 例 3-9】 判 断 输入 的 数字 是 否 可 以 被 3 或 5 整除 : 


number=int (input (" 输 入 一 个 数字 : ") ) 
if numbers3==0: 
if numbers5==0 
Print ("你 输入 的 数字 可 以 整除 3 或 5") 
else: 
print ("你 输入 的 数字 可 以 整除 3， 但 不 能 整除 5") 
else: 
if number%®5==0: 
print ("你 输入 的 数字 可 以 整除 5， 但 不 能 整除 3") 
else: 


print ("你 输入 的 数字 不 能 整除 3 或 5") 
执行 以 上 代码 ， 运 行 4 次， 输出 结果 为 : 





输入 一 个 数字 : 

你 葵 太 的 数字 训 以 束 队 3 或 5 

>>> 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
>>2 

输入 一 个 数字 : 9 

你 输入 的 数字 可 以 整除 3， 但 不 能 整除 5 
PP 

2 

输入 20 

你 输入 的 数字 可 以 整除 5， 但 不 能 整除 3 
>>> ”一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
>>> 

输入 一 个 数字 : 

你 给 入 的 数字 不 能 整除 3 或 5 

>>> 


3.2 for 循环 


本 节 将 介绍 Python 循环 语句 的 使 用 。Python 中 的 循环 语句 有 for 和 while 两 种 ， 本 节 
介绍 for 循环 。 
Python 中 for 循环 的 控制 流程 如 图 3-2 所 示 。 


.TAN 
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判断 循环 条 件 
True 


False 





3-2 for 循环 的 控制 流程 


3.2.1 for 循环 的 基本 结构 


Python 中 ，for 循环 可 以 遍历 任何 序列 的 项 目 ， 如 字符 串 、 元 组 、 列 表 、 文 件 等 ， 也 
可 以 遍历 非 序列 的 字典 。 
for 循环 的 一 般 格 式 如 下 : 


for <variable> in <sequence>: 
<statements 1> 

else: 
<statements 2> 


【 例 3-10】 遍 历 字符 串 : 


word = input ("输入 字符 串 : ") 
tripleWord = "" 
for w in word: 
tripleWord += Ww*3 
print (" 三 倍 字符 串 是 : " + tripleWord + "。") 
执行 以 上 代码 ， 输 出 结果 为 : 
输入 字符 串 : aeiou 


三 倍 字 符 串 是 : aaaeeeiiiooouuu。 
>>> 


【 例 3-11】 遍 历 元 组 : 


Languages = (SECM MC MAVAT pythons) 
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for x in languages: 
Print (x) 


执行 以 上 代码 ， 输 出 结果 为 : 
[ 
C++ 
JAVA 
Python 
>>> 


【 例 3-12】 遍 历 列表 : 
people = [" 美 国人 "," 英 国人", "德国 人 ", "法 国人 ", "韩国 人 "," 俄 国人", "Chinese",] 


for i in range (len (people)): 
people[i] = people[i] [0:2] 
print (people) 
执行 以 上 代码 ， 输 出 结果 为 : 
[' 美 国 '，' 英 国 '，' 德 国 '，' 法 国 '，' 韩 国 '，' 俄 国 '，'Ch'] 
>>> 


逮 注意 : 
@ range(len(people)) 相 当 于 range(7)，for 循环 的 1 变量 取 值 从 0 到 6， 即 : i=0,，1， 
2, 3, 4, 5,6. 
@@ ”people[i][0:2] 是 取 每 个 people 列表 元 素 的 前 两 个 字符 。 


【 例 3-13】 遍 历 字 典 : 


months = {'January':l1l, 'February':2, 'March':3, 'April':4, 'May':5} 
for key in months: 

print (key, '—-',months [key] ,end=' ') 

#end 保证 同行 输出 并 隔 2 个 空格 ( 详 见 3.4.6 节 ) 


print () 坦 换 行 

for value in months .values () : # 使 用 字典 方法 values () 
print('values = ',value,end=' ') 

print() 

for key, value in months .items () : # 使 用 字典 方法 items () 
print (key, '--',value,end=' ') 

执行 以 上 代码 ， 输 出 结果 为 : 

January -- 1 February -- 2 April -- 4 March -- 3 May -- 5 

values = 1 values = 2 values = 4 values = 3 Values= 5 

January -- 1 February -- 2 April -- 4 March -- 3 May -- 5 

>>> 


注意 : 字典 元 素 的 输出 顺序 通常 不 固定 。 换 名 话说， 迭代 的 时 候 ， 字 典 中 的 键 和 值 
都 能 保证 被 处 理 ， 但 是 处 理 顺序 不 确定 。 如 果 顺 序 很 重要 ， 可 以 将 键 值 保存 
在 单独 的 列表 中 或 者 排序 输出 。 


【 例 3-14】 文 本 文件 的 行 遍历 : 


firstName = input ("输入 姓氏 : ") 
file = open("xingming.txt",'r') 
a 
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;3 i 人 


if f.startswith (firstName): 
print (f.rstrip()) 
file.close() 


执行 以 上 代码 ， 输 出 结果 为 : 
人 2 张 


焉 注意 : 

@ ”open() 哆 数 用 于 打开 文件 ， 即 建立 程序 和 文件 的 连接 ， 人 允许 程序 从 文件 中 读 取 数 
据 。 我 们 把 程序 和 文件 放 到 同一 个 文件 夹 中 ， 这 样 就 可 以 只 用 文件 名 ,而 不 用 文 
件 的 完整 路 径 。 

@ xingming.txt 中 有 6 个 名 字 ， 分 别 是 张 伯 、 张 仲 、 张 叔 、 张 季 、 李 刚 、 王 明 ， 文 本 
文件 的 每 一 行 由 一 个 换行 符 结束 ，rstrip() 函 数 用 于 移 除 这 个 字符 。 

@ close0 函 数 用 于 关闭 文件 ， 即 断 开 程序 和 文件 的 连接 。 

@@ open() 和 close() 两 个 函数 将 在 第 5 章 做 具体 介绍 。 


3.2.2 for 循环 嵌 套 
Python 语言 允许 在 一 个 循环 体内 嵌入 另 一 个 循环 ， 其 一 般 形式 如 下 : 


for <variablel> in <sequencel>: 
for <variable2> in <sequence2>: 
<statements 1> 
<statements 2> 


【 例 3-15】 双 重 循 环 的 应 用 : 
for i in range(5,10): 
for j in range(5,10): 


print (mxmy nn ixj,end=' ') 
print("\t",end="'') 


执行 以 上 代码 ， 输 出 结果 为 : 

5*#5=25 5*6=30 5*7=35 Sw a a0 5*9=45 
6*5=30 6*6=-36 6 *7=42 6*8=48 6*9=54 
7 三 二 了 a 了 = 
8*5=40 8*6—-48 8 * 7 =- 56 8 x 8 = 64 8 x 9 = 72 
9 * 5= 45 9*6=54 9 * 7 = 63 9*8=72 9*9= 81 
es 


第 1 行 设 定 变量 i 从 5 到 10( 不 含 10) 变 化 ， 每 次 自动 加 1。 

第 2 行 设 定 变量 j 从 5 到 10( 不 含 10) 变 换 ， 每 次 自动 加 1。 

第 3 行 是 打印 语句 ， 因 为 print0 函 数 的 最 后 有 end="( 两 个 单 引 号 ， 中 间 无 空格 ， 不 是 
一 个 双 引 号 ， 也 可 以 是 两 个 双 引 号 ， 见 下 例 )， 所 以 每 一 次 循环 都 不 会 换行 ， 详 细 用 法 请 参 
考 3.4.6 节 。 

第 4 行 是 表示 输出 一 个 制 表 符 之 后 不 换行 。 
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站 注意 : 
@@ ”双重 循环 的 缩 进 格式 很 重要 ， 这 里 再 次 强调 ，Python 有 非常 严格 的 语法 规定 。 
@ for 语句 的 判断 标准 是 先 判断 后 执行 ， 所 以 过 10 是 不 执行 的 ， 因 此 该 程序 是 从 
5x5=25 算 到 9x9=81。 


【 例 3-16】 双 重 循环 输出 举例 : 


number = int (input (" 输 入 一 个 数字 : ") ) 
for i in range(0,number) : 
for j in range(0,i+l) : 
print("*",end="") 





print() 
执行 以 上 代码 ， 输 出 结果 为 : 
输入 一 个 数字 : 4 
>>> 


3.2.3 for 循环 中 使 用 else 分 支 


Python 的 for 循环 有 一 个 可 选 的 else 分 支 (类 似 让 语句 那样 )， 在 循环 迭代 正常 完成 之 
后 执行 。 换 名 话说， 如 果 我 们 以 正常 的 方式 退出 循环 ， 那 么 else 分 支 将 被 执行 ， 但 如 果 在 
循环 体内 执行 了 break 语句 、return 语句 而 退出 循环 ， 或 者 有 异常 出 现 而 退出 循环 ， 那 么 
else 分 支 将 不 会 被 执行 。 下 面 考 虑 一 个 简单 的 例子 。 

【 例 3-17】 执 行 else 分 支 的 for 循环 : 

for i in range(5) : 

print (i) 
ele 


print ("没有 更 多 的 数字 ") 
执行 以 上 代码 ， 输出 结果 为 : 


wm 


没有 更 儿 的 数字 
循环 正常 完成 ， 所 以 else 分 支 也 被 执行 ， 并 打印 “没有 更 多 的 数字 ”。 
如 果 循 环 所 和 迭代 的 序列 是 空 的 ，else 分 支 依然 会 被 执行 。 
【 例 3-18】 和 迭代 序列 为 空 时 执行 else 分 支 : 
FOr i A 
print (i) 


else: 


print ("for 循环 后 执行 该 语句 ") 
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yn 人 
执行 以 上 代码 ， 输 出 结果 为 : 
[全 环 后 直行 议 语 名 
沉 
如 果 用 break 语句 终止 循环 ， 那 么 else 分 支 将 不 会 被 执行 。 
【 例 3-19】 不 执行 else 分 支 的 for 循环 : 


sites = ["Baidu", "Google","Lenovo","Apple"] 
for site in sites: 


if site == "Lenovo": 
print ("联想 集团 !") 
break 
elses 


print ("没有 匹配 数据 !") 
print ("完成 循环 !") 


执行 以 上 代码 ， 输 出 结果 为 : 
联想 集团 ! 
完成 循环 ! 
> 
站 注意 : 执行 程序 时 ， 在 循环 到 Lenovo 时 会 跳出 循环 体 ，else 分 支 不 再 执行 。 
break 语句 用 于 跳出 循环 体 ， 具 体 用 法 参见 3.4.4 节 。 


3.2.4 列表 解析 


如 果 listl 是 一 个 列表 ， 那 么 : 

Et ore in LLsEL] 

将 创建 一 个 新 列表 ， 并 将 listl 中 的 每 个 元 素 放 入 新 列表 中 ， 其 中 f(x) 为 Python 的 内 建 
函数 或 用 户 自 定义 函数 。 

【 例 3-20】 列 表 解 析 举 例 : 


Te Te 





print ([int(x) for x in list1]) # 将 1istl 中 的 所 有 数 转换 为 整数 ( 割 尾 取 整 ) 
print ([int(x) for x in [2.3,3.4,4.5,5.6,6.7]]) # 将 列表 中 所 有 的 数 转换 为 整数 
print ([int(x)**2 for x in list1]) # 打 印 1istl 中 所 有 数 的 平方 


BPrint ((int(x)**2 For x an lstl 1f int(x) $ 2 .== 0]) 
# 只 打印 1ist1 中 偶数 的 平方 


执行 以 上 代码 ， 输 出 结果 为 : 
i 

[2, 3, 4, 5, €] 
[e253 

[4, 16, 36] 


注意 : 除 列表 外 ， 列 表 解 析 也 可 以 应 用 在 其 他 对 象 上 ， 如 字符 囊 、 元 组 和 用 range() 
函数 产生 的 算术 表达 式 。 
【 例 3-21】 应 用 在 其 他 对 象 上 的 列表 解析 : 
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print (Tord(z) for z Lin "abced®]) 

print ‘(I[int (zx)**0.5 for x in (=1,9,16) if x >= 0]) 
print ([x**3 for x in range(3)]) 

执行 以 上 代码 ， 输 出 结果 为 : 


[97, 98, 99, 100] 


[3507 ‘450] 
[0, 1, 8] 
>>> 


3.3 range() 函 数 


range0 函 数 在 前 面 已 使 用 多 次 ， 读 者 对 这 一 内 建 函数 的 用 法 已 略 知 一 二 。 由 于 其 应 用 


颇 广 ， 本 节 对 此 单独 做 详细 介绍 。 


函数 原型 :range(start,end,step) 

参数 含义 ; 

start 一 一 计数 从 start 开始 ， 默 认 是 从 0 开始 。 例 如 range(5) 等 价 于 range(0.5)。 
end 一 一 计数 到 end 结束 ， 但 不 包括 end。 例 如 range(0,5) 是 [0, 1, 2, 3, 4]， 没 有 5。 
step 一 一 每 次 跳跃 的 间距 ， 或 称 步 长 ， 默 认为 1。 例 如 range(0,5) 等 价 于 range(0, 5, 1)。 
例如 : 

range(3,12,2) 产 生 的 序列 是 3、5、7、9、11。 

range(0,22,4) 产 生 的 序列 是 0、4、8、12、16、20。 

range(-10,20,5) 产 生 的 序列 是 -10、-5、0、5、10、15( 注 意 没有 20)。 

如 果 步 长 值 为 负数 ， 并 且 初 始 值 大 于 终止 值 ， 则 range0 函 数 产生 一 个 递减 的 序列 ， 它 


由 初始 值 开始 ， 递 减 至 终止 值 。 


/eo\. 


例如 : 
range(4,0,-1) 产 生 的 序列 是 4、3、2、1。 
range(8,-2,-3) 产 生 的 序列 是 8、5、2、-1。 
range(-1,-10,-2) 产 生 的 序列 是 -1、-3、-5、-7、-9。 
使 用 range() 函 数 可 以 生成 数字 序列 ， 而 且 可 以 使 用 单个 参数 、 两 个 参数 、 三 个 参数 。 
【 例 3-22】 使 用 range0 函 数 产 生 等 差 数 列 一 一 单个 参数 的 应 用 : 
for i in range(6): 
print (i) 


执行 以 上 代码 ， 输 出 结果 为 : 
0 


MONP 


>>> 
【 例 3-23】 使 用 range0 函 数 产 生 指定 区 间 的 值 一 一 两 个 参数 的 应 用 : 


for i in range(5,10) : 
print (i) 
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执行 以 上 代码 ， 输 出 结果 为 : 
6 
J 
8 


>>> 


【 例 3-24】 使 用 range0 函 数 产 生 偶数 序列 一 一 三 个 参数 的 应 用 : 


for LT un rangel0> L107 2) 
print (i) 


行 以 上 代码 ， 输 出 结果 为 : 





【 例 3-25】range0) 函 数 的 应 用 一 一 参数 为 负数 : 


for i in range(-10, -100, -20) : 
print (i) 


执行 以 上 代码 ， 输 出 结果 为 : 
-10 
-30 
-50 
Eo 
-90 
>>> 


也 可 以 结合 range0 和 len0 函 数 以 遍历 一 个 序列 的 索引 ， 如 下 例 所 示 。 
【 例 3-26】 遍 历 列表 : 


a = ['Lenovo','Google','Baidu','Tencent','Alibaba','Apple','SINA'] 
for i in range(len(a)) : 
print (i, a[i]) 


执行 以 上 代码 ， 输 出 结果 为 : 
Lenovo 

Google 

Baidu 

Tencent 

Alibaba 

Apple 

SINA 

> 


还 可 以 使 用 range0 函 数 来 创建 一 个 列表 ， 并 且 打 印 出 来 。 
【 例 3-27】 创 建 列表 : 

print (list (range (5))) 

执行 以 上 代码 ， 输 出 结果 为 : 


[0, 1, 2, 3, 4] 
>>> 
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在 Python 中 不 能 声明 和 矩阵， 也 不 能 列 出 维 数 ， 但 可 以 利用 列表 中 夹带 列表 的 形式 表 
示 ， 即 利用 嵌 套 的 列表 来 表示 。 
【 例 3-28】 生 成 3x3 的 和 矩阵: 


count = 
array = [] 
for i in range(0, 3): 
tmp = [] 
for j in range(0, 3): 
tmp .append (count) 
count =count + 1 
array.append (tmp) 
print (array) 


执行 以 上 代码 ， 输 出 结果 为 : 
TE 
>>> 


【 例 3-29】 和 矩阵 初始 化 (全 部 元 素 赋 0 值 ): 


array = [] 
for i in range(0, 3): 
tmp = [] 
for j in range(0, 3): 
tmp.append (0) 
array.append (tmp) 
print (array) 


执行 以 上 代码 ， 输 出 结果 为 : 


[[O, 0, 0], [0, 0, 0], [0, 0, 0]] 
>>> 


尽管 使 用 列表 实现 矩阵 轻而易举 ， 但 借助 第 三 方 扩展 库 将 更 加 方便 、 更 加 灵活 ， 相 关 
内 容 请 读者 参考 第 9 章 的 例 9-4。 
【 例 3-30】 编程 实现 排序 功能 : 
Se 
for i in range(len(a) - 1, 0, -1): # 等 价 于 range (1，len(a)，1) 
for j in range(0, i): 
Eval > val Ll 
eimai eu a a 
print (a) 
执行 以 上 代码 ， 输 出 结果 为 : 
till S22 dS nr GIr Bo] 
这 


说 明 如 下 。 

中 a 是 一 个 乱 序 的 列表 。 

@) range(len(a)-1,0.-1) 也 就 是 range(6,0,-1)， 意 思 是 从 6 到 0 间隔 -1 产生 序列 ， 也 就 
是 倒序 的 range(1,7,1)， 随 后 把 这 些 值 依次 赋 给 1， 那么 i 的 值 将 会 是 [6, 5, 4, 3, 2.1] 。 

图 第 2 个 for 是 内 层 循环 ，j 的 值 将 随 i 而 变化 ， 每 次 分 别 是 [0, 1, 2, 3, 4, 5]、[0, 1, 2， 
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四 ”比较 第 j 个 元 素 和 第 j+1 个 元 素 的 大 小 。 

回 若 a 中 大 ， 则 交换 第 j 个 元 素 和 第 j+l 个 元 素 ( 即 前 面 的 大 时 交换 )。 

@ 打印 排序 后 的 列表 。 

本 例 程序 所 用 的 排序 算法 是 一 个 很 有 名 的 算法 ， 称 作 “ 冒 泡 排序 ”。 如 果 不 想 公开 本 
例 所 用 的 算法 ， 则 可 以 用 C 或 C++ 语言 编写 这 一 部 分 代码 ， 再 编写 相应 的 封装 接口 ， 将 其 
实现 为 Python 中 的 一 个 模块 ， 引 入 到 Python 程序 中 。 因 本 书 篇 幅 所 限 ， 有 具体 方法 请 读者 
参考 文献 [27]。 

事实 上 ， 我 们 完全 没有 必要 通过 编程 来 实现 排序 ， 因 为 Python 内 建 了 sort0 函 数 ， 可 
直接 用 于 排序 ， 这 样 一 来 ， 不 仅 使 用 方便 ， 而 且 速 度 快 ， 对 数据 类 型 的 适应 性 也 很 强 。 

【 例 3-31】 直 接 调 用 sort0 函 数 实现 排序 : 

FF Di Lo or Gt G2 A430 

a.sort() 

print (a) 

[sR 0 MD Dt ee 六 全 省 人 四 作业 才 光 二 < 

b.sort() 

print (b) 

执行 以 上 代码 ， 输 出 结果 为 : 

[L121 327 A437 S53r G7 'B2] 

I © dd Bl 0 ed | 

>>> 














3.4 ”while 循环 
Python 循环 语句 while 的 执行 流程 如 图 3-3 所 示 。 
3.4.1 while 循环 基本 结构 
Python 中 while 循环 的 一 般 形式 如 下 : 


while <expression>: 
<statements 1> 


同样 需要 注意 冒号 和 缩 进 。 另 外 ， 与 C 语言 不 同 ， 在 Python 中 没有 do...while 循环 。 
【 例 3-32】 使 用 while 循环 语句 计算 1 到 1n 的 总 和 ， 这 里 n=100。 


n = int (input ("输入 一 个 数字 :")) # 输 入 一 个 数 ， 并 转换 成 整数 
sum = 0 # 求 和 变量 初始 化 为 0 
counter = 1 ## 计 数 器 初始 化 为 1 
while counter <= n: 间 计 数 器 <=100 时 
sum += counter # 求 和 变量 加 上 counter 
counter += 1 井 计数 器 增 1 


print ("1 到 $d 之 和 为 : $d" s (n,sum))  # 打 印 结果 


(ea. 
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True 


执行 相关 代码 






False 


图 3-3 while 循环 的 执行 流程 
执行 以 上 代码 ， 输 出 结果 为 : 


输入 一 个 数字 :100 
1 到 100 之 和 为 : 5050 
> 


泪 注意 : 使 用 复合 运算 符 或 称 增 量 运 算 符 (+=、-+、*+、/ 三 、%= 等 )， 代 码 显 得 更 加 紧 
凑 、 简 洁 ， 并 且 易 读 ， 读 者 应 掌握 这 种 用 法 。 
【 例 3-33】 通 过 设置 条 件 表达 式 永远 为 True 来 实现 无 限 循环 : 


on 

while a == 1 : # 表 达 式 永远 为 True 
num = int (input ("输入 一 个 数字 :")) 
print ("你 输入 的 数字 是 : "，num) 


执行 以 上 代码 ， 输 出 结果 如 下 : 
输入 一 个 数字 :1 
你 输入 的 数字 是 : 1 
输入 一 个 数字 ”:-1 

你 输入 的 数字 是 : -1 

输入 一 个 数字 :1234567890987654321 
你 输入 的 数字 是 : 1234567890987654321 
输入 一 个 数字 : 


Traceback (most recent call last) : 
File“C:/Windows/System32/hh. py”, 
num = int(input( 输入 一 个 数字 : 
File “C:\Users\Administrator\AppData\Local\Programs\Python\Python35-32\1ib\idl 
elib\PyShell. py”, line 1389, in readline 
line = self._line buffer or self. shell. readlineO 
KeyboardInterrupt 
>>> 


ne 3, in 《module> 
:”)) 
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@ “可 以 按 CHl+C 组 合 键 来 退出 当前 的 无 限 循环 ， 但 退出 时 将 引发 KeyboardInterrupt( 键 
盘 中 断 ) 异 常 。 
@ 无 限 循环 对 服务 器 上 客户 端的 实时 请 求 非常 有 用 。 


3.4.2 ”while 循环 坐 套 
Python 中 while 循环 的 嵌 套 形式 如 下 : 


while <expressionl>: 
while <expression2>: 
<statements 1> 
<statements 2> 


while 循环 也 可 以 在 循环 体内 嵌入 其 他 的 循环 体 ， 如 在 while 循环 中 可 以 嵌入 for 循 
环 ， 反 之 ， 也 可 以 在 for 循环 中 嵌入 while 循环 。 
【 例 3-34】 使 用 嵌 套 循环 输出 20~50 之 间 的 素数 : 
i=20 
while(i < 50): 
j=2 
while(j <= (i/j)): 
if not(i%j): break 
下 二 下 神 
TESTOOEW 是 来 数 习 
二 下 于 
执行 以 上 代码 ， 输 出 结果 如 下 : 
23 ”是 素数 


3.4.3 ”while 循环 中 使 用 else 分 支 


while ... else 在 条 件 语 句 为 False 时 执行 else 后 的 语句 块 。 
【 例 3-35】else 分 支 在 while 循环 中 的 使 用 : 


co =°0 

while cou <= 3: 
print (cou，" 小 于 或 等 于 3") 
econ t= 

elses 
polimt pteon nek Sn 


执行 以 上 代码 ， 输 出 结果 如 下 : 
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0 “小 于 或 等 于 3 

1 小 于 或 等 于 3 

2 小 于 或 等 于 3 

S30 小 于 或 等 于 3 

a 大 3 

>>> 

类 似 直 语句 的 语法 ， 如 果 while 循环 体 中 只 有 一 条 语句 ， 也 可 以 将 该 语句 与 while 写 
在 同一 行 中 ， 如 下 例 所 示 。 

【 例 3-36】 单 行 循环 体 : 


War = 
while (var): print ('hello Python') 
print ("bye!") 


本 例 程序 中 ， 循 环 体 只 有 一 行 ， 与 while 写 在 了 同一 行 上 ， 可 能 书写 起 来 比较 方便 ， 
但 这 样 的 代码 可 读 性 差 ， 希 望 读 者 将 这 行 代码 移 到 下 一 行 并 合理 地 缩 进 。 另 外 一 个 原因 
是 ， 如 果 需 要 添加 新 的 代码 ， 读 者 还 是 需要 把 它 移 到 下 一 行 ， 使 用 标准 的 形式 。 

执行 以 上 代码 ， 输 出 结果 如 图 3-4 所 示 。 由 于 程序 采用 了 死 循环 ， 不 得 不 使 用 Ctrl+C 
中 断 执行 ， 因 而 最 后 引发 了 与 例 3-33 一 样 的 KeyboardInterrupt 异常 。 


hello Python 
hello Python 
hello Python 
hello PythonTraceback (most recent call last): 

File "D:\Python34\textl.py", line 2, in <module> 

while (var): print ('hello Python') 

File "C:\Users\Administrator\AppData\Local\Progr 
ams\Python\Python35-32\lib\idlelib\PyShell.py", 1i 
ne 1347, in write 

return self.shell.write(s, self.tags) 
KeyboardInterrupt 
>>> 








图 3-4 例 3-36 的 运行 结果 
3.4.4 ”break 和 continue 语句 在 循环 中 的 使 用 


break 语句 可 以 跳出 for 和 while 的 循环 体 。 如 果 程 序 从 for 或 while 循环 中 终止 ， 则 循 
环 所 对 应 的 else 块 将 不 执行 。 
【 例 3-37】break 语句 在 for 循环 中 的 使 用 : 
for letter in "helloworld': 
if letter == "1': 
break 
print (' 当 前 字母 :'，1letter) 


执行 以 上 代码 ， 输 出 结果 如 下 : 


当前 字母 : h 
当前 字母 : e 
>>> 


【 例 3-38】break 语句 在 while 循环 中 的 使 用 : 
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Var = "5 
while var > 0: 
print (' 当 前 变量 值 是 :'，var) 
var = 1 
if var == 3: 
break 


执行 以 上 代码 ， 输 出 结果 如 下 : 

当前 变量 值 是 : 5 

当前 变量 值 是 : 4 

>>> 
continue 语句 告诉 Python 跳 过 当前 循环 体 中 的 剩余 语句 ， 然 后 继续 进行 下 一 轮 循环 。 
【 例 3-39】continue 语句 在 for 循环 中 的 使 用 : 


for letter in "helloworld': 
if letter == "1': 
continue 
print (' 当 前 字母 :'，letter) 


执行 以 上 代码 ， 输 出 结果 如 下 : 


当前 字母 : h 
当前 字母 : e 
当前 字母 : o 
当前 字母 : w 
当前 字母 : o 
当前 字母 : 工 
当前 字母 : d 
>>> 
【 例 3-40】continue 语句 在 while 循环 中 的 使 用 : 
War = 5 
while var > 0: 
i se 
if var == 3: 
continue 
elses: 


print (' 当 前 变量 值 是 :'，var) 
执行 以 上 代码 ， 输 出 结果 如 下 : 
当前 变量 值 是 : 4 
当前 变量 值 是 : 2 
当前 变量 值 是 : 1 
当前 变量 值 是 : 0 


3.4.5 ”pass 在 循环 中 的 使 用 


Python 的 pass 是 空 语 句 ， 旨 在 保持 程序 结构 的 完整 性 。pass 不 做 任何 事情 ， 一 般 用 作 
占 位 语句 。 
【 例 3-41】pass 语句 的 使 用 : 


for letter in "hello': 
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if letter == "1': 
pass 
print (' 执 行 pass 语句 ') 
print (' 当 前 字母 :'，letter) 
执行 以 上 代码 ， 输 出 结果 如 下 : 
当前 字母 : h 
当前 字母 : e 
执行 pass 语句 
当前 字母 : 1 
执行 pass 语句 
当前 字母 : 1 
当前 字母 : o 
>>> 


3.4.6 end 在 循环 中 的 使 用 


默认 情况 下 ，print 语句 输出 时 自动 换行 ， 使 用 end=“， 可 将 结果 输出 到 同一 行 ， 或 在 
输出 的 末尾 添加 其 他 字符 。 此 功能 前 面 已 使 用 多 次 ， 这 里 再 举 一 例 ， 进 一 步 说 明 其 用 法 。 

【 例 3-42】 打 印 100 以 内 的 斐 波 那 契 数列 。 

意大利 数学 家 斐 波 那 契 曾 研究 一 种 递归 数列 ， 后 人 称 其 为 斐 波 那 契 数列 。 该 数列 的 前 
两 项 均 为 1， 从 第 三 项 开始 ， 每 一 项 都 等 于 其 前 两 项 之 和 。 代 码 如 下 

Be 

while b <= 100: 


print (b, end="',') #print (b) 
ab = b, a+b 


执行 以 上 代码 ， 输 出 结果 如 下 : 
1,1,2,3,5,8,13,21,34,55,89, 
>>> 


还 注意 : 
@ 第 一 行 包含 一 个 复合 赋值 : 变量 a 和 b 同时 得 到 新 值 0 和 1。 最 后 一 行 再 次 使 用 同 
样 的 方法 。 
@ 复合 赋值 语句 右边 的 表达 式 会 在 赋值 变动 之 前 执行 。 右 边 表达 式 的 执行 顺序 是 自 
左 向 右 的 。 
@。 如 果 用 注释 中 的 打印 语句 ， 裴 波 那 契 数列 会 按 一 行 一 个 数 打印 输出 。 


3.5 “案例 实 训 : 输出 所 有 和 为 某 个 正 整数 的 连续 正 数 序列 


小 明 很 喜欢 数学 ， 有 一 天 ， 他 在 做 数学 作业 时 ， 题 目 要 求 计算 出 9~16 的 和 ， 他 马上 
就 写 出 了 正确 答案 : 100。 但 是 他 并 不 满足 于 此 ， 他 在 想 ， 完 竟 有 多 少 种 连续 的 正 数 序列 
的 和 为 100( 至 少 包括 两 个 数 )? 没 多 久 ， 他 就 得 到 另 一 组 连续 正 数 和 为 100 的 序列 : 18， 
19，20，21，22。 现 在 我 们 使 用 Python 编程 ， 找 出 所 有 和 为 $S 的 连续 正 数 序列 。 

题目 描述 : 输入 一 个 正 整数 SS>2)， 输 出 所 有 和 为 S 的 连续 正 整 数 序列 。 要 求 先 输出 
符合 要 求 的 序列 的 数目 ， 然 后 分 行 输出 各 个 序列 。 
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题目 分 析 : 1+2+...，“ 展 右 端 ”"， 即 总 是 加 最 右 端 的 数 ， 直 至 其 和 等 于 输入 数 ， 或 大 
于 输入 数 ， 若 等 于 输入 数 ， 则 输出 该 序列 ; 若 大 于 输入 数 ， 则 依次 “ 砍 左 端 ”， 即 依次 减 








掉 最 左 端的 数 ， 直 到 序列 和 小 于 输入 数 。 
算法 如 下 。 
(1) 输入 数 (大 于 2 的 正 整数 )。 
(2) 找到 输入 数 的 12， 作 为 序列 中 值 。 
(3) 当前 和 =1+2。 
(4) 当 左 端 数 > 中 值 时 ， 转 (8)。 
(5) 如 果 序列 和 = 输入 数 ， 则 输出 该 序列 ， 然 后 “ 展 右 端 ”， 求 新 序列 的 和 ， 转 (4)。 
(6) 如 果 序列 和 > 输入 数 ， 则 “ 砍 左 端 ”， 转 (4)。 
(7) 如 果 序列 和 < 输入 数 ， 则 “ 展 右 端 ”， 求 新 序列 的 和 ， 转 (4)。 
(8) 输出 序列 。 
程序 如 下 : 
# 求 连续 正 数 和 问题 


print ("请 输入 大 于 2 的 正 整数 : ") 
tsum=int (input ()) 
while (tsum<=2): 


print ("请 输入 大 于 2 的 正 整数 : ") 


tsum=int (input ()) 


begin = 1 # 首 元 素 
end = 2  # 尾 元 素 


middle 
curSum 


(tsum + 1) >>1 # 右 移 一 位 ， 获 取 中 间 值 ， 相 当 于 除 以 2 
begin + end # 连 续 序 列 的 和 (最 小 的 连续 序列 和 为 1+2=3， 故 从 3 开始 ) 


output = [] # 保 存 结果 的 列表 (有 几 个 序列 ， 其 中 就 有 几 个 子 列表 ) 
while begin < middle: #“ 展 右 端 ， 砍 左 端 ” 


if cursum == tsum: 车 cursum==tsum， 则 符合 条 件 
output .append ( [begin，end] ) # 将 序列 的 首尾 元 素 列表 (2 元 素 ) 添加 到 output 
end += 1 # 为 寻找 下 一 个 可 能 的 序列 作 准备 
cursum += end 

elif cursum > tsum: # 若 curSum>tsum， 则 从 cursum 中 减 去 begin，begin 再 增 1 


curSum -= begin 
begin += 1 

else: # 若 curSum<tsum， 则 end 先 增加 1，cursum 再 加 上 end 
二 


cursum += end 


井 按 照 指定 格式 输出 结果 
if len (output) !=0: 


print ("有 {0} 种 序列 : " .format (len (output) ) ) 
for i in range(0,1en(output),1): 
print ("序列 {0}: ".format (i+1)) 
for j in range (output[i] [0],output[i]l [1]+1) : 
print(j,end=' ') 
EnEIERNGST 


Elsea 


print (" 没 有 满足 条 件 的 序列 ! ! ! ") 
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执行 两 次 以 上 代码 ， 输 出 结果 为 : 











请 输入 大 于 2 的 正 整 数 : 

省 2 种 序列 : 

序列 1: 
四 
序列 2: 

S190 200 21022 
二 
清 答 入 大 于 2 的 正 整 数 : 
没有 满足 条 件 的 序列 ! ! ! 

> 


程序 中 使 用 了 一 个 嵌 套 的 output 列表 ， 用 于 存储 符合 条 件 的 序列 ， 但 存储 的 是 该 序列 
的 首尾 两 个 数 ， 输 出 时 则 输出 整个 序列 。 


本 章 小 结 


本 章 主 要 介绍 与 选择 和 循环 相关 的 内 容 。 首 先 介 绍 了 过、if-else、if-elif-else 三 种 语句 
的 一 般 形式 ， 介 绍 了 三 元 运算 符 和 比较 操作 符 ， 以 及 if 的 嵌 套 用 法 ， 其 次 介绍 了 for 循环 
的 控制 结构 、 一 般 格式 及 其 嵌 套 使 用 ， 然 后 介绍 了 range0 函 数 的 功能 及 各 参数 的 用 法 ， 并 
列举 了 详尽 的 例子 ， 接 着 介绍 了 while 语句 的 一 般 形 式 、 嵌 套用 法 ; 最 后 介绍 了 如 何在 循 
环 中 使 用 else 分 支 ， 以 及 break、continue 和 pass 语句 在 循环 中 的 使 用 等 。 


1. 填空 题 


(1) 一 般 而 言 ， 过 、while、for 语句 的 行 末 要 使 用 ( )( 标 点 符号 )。 
(2) 下 列 程序 的 输出 结果 是 ( ): 
a=3 
b=3 
print(a is b) 
(3) range(1,10,3) 的 值 是 ( Nn 
(4) [x**3 for x in [1,2,3,4,5]] 的 结果 是 ( 六 
(5) 下 列 程序 的 运行 结果 是 ( 站 
strl="E: \TJPU\YLH\TEST .TXT" 
For i in strl: 

pS 

print (i,end="'') 


./e0\. 
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2. 选择 题 
(1) 执行 下 列 语句 后 的 显示 结果 是 (  ): 


world="world" 
print ("hello"+ world) 


A. helloworld B. “hello™ world 
C. hello world D. 语法 错误 
(2) 下 列 Python 语句 中 正确 的 是 ( 。 )。 
A.(min=x if x<y) else y Bmx=—=x>y?x:y 
C.if(x>y) print x D. while True : pass 
(3) 已 知 xX=43，y=False; 则 表达 式 (Xx >=y and ‘A’ < ‘B’” and not y) 的 值 是 ( 
A. False B. 语法 错 C. Tme D. 假 


(4) 以 下 程序 的 输出 结果 是 (提示 : ord('a) 一 97)( 。 ): 


TStan = lm2r3r A Sr a be dl 
print (lista[2] + ord(lista[5])) 


A. 100 Bd Cd D. TypeError 
(5) 下 列 哪个 语句 在 Python 中 是 非法 的 ? (。 ) 
六: 证 二 站 二 三 Bs(y=sz+t 
C= 1 
(6) 下 面 的 循环 体 执行 的 次 数 与 其 他 不 同 的 是 (  )。 
A.i=0 
while( i <= 100): 
print (i) 
于 二 和 主 寺 并 


B. for i in range(100): 
print (i) 
C.for i in range(100, 0, -1): 
print (i) 
D. El00 
while(i > 0): 
print (i) 
i=i-1 
3. 问答 题 
(1) 分 析 逻 辑 运算 符 or 的 短路 求 值 特性 。 
(2) Python 中 pass 语句 的 作用 是 什么 ? 
(3) 简 述 Python 中 range(O 函 数 的 用 法 。 
(4) Python 中 break、continue 语句 的 作用 是 什么 ? 
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4. 实验 操作 是 


(1) 编写 输出 10 以 内 素数 的 循环 程序 。 

(2) 使 用 felif-else 语句 判断 输入 的 数字 是 正 数 、 负 数 还 是 零 。 使 用 谱 套 的 这 语句 实 
现 同样 的 功能 。 

(3) 用 于 语句 判断 输入 的 一 个 数字 是 奇数 还 是 偶数 。 

(4) 用 让 语句 判断 用 户 输 入 的 年 份 是 否 为 头 年 。 

(5) 使 用 标准 格式 输出 阶乘 (factoriaD)。 整 数 的 阶乘 是 所 有 小 于 及 等 于 该 数 的 正 整数 的 
积 ， 即 : nl=1x2x3x... xn。0 的 阶乘 定义 为 1。 

(6) 改进 九 九 乘法 表 ， 用 for 语句 和 Irange0 函 数 实现 。 建 议 使 用 end 换行 。 

(7) 求 指定 区 间 内 的 水 仙 花 数 ( 亦 称 阿姆斯特朗 数 )， 要 求 使 用 循环 语句 和 判断 语句 。 

如 果 一 个 n 位 正 整数 等 于 其 各 位 数字 的 立方 之 和 ， 则 称 该 数 为 水 仙 花 数 或 阿姆斯特朗 
数 。 例 如 3^3 + 7^3 + 0^3 = 370。1000 以 内 的 水 仙 花 数 有 : 1, 2, 3, 4, 5, 6, 7, 8, 9, 153, 370， 
371, 407。 
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本 章 要 点 


(1 
2 
G3) 
(4) 
G) 
(0) 
(7) 
(8) 
(9) 


Python 代码 编写 规范 和 风格 。 
函数 的 定义 与 调用 。 

了 Python 变量 作用 域 。 

函数 与 递归 。 

和 迭代 器 与 生成 器 。 

Python 自 定义 模块 。 

输入 输出 语句 的 基本 格式 及 执行 规则 。 
匿名 函数 的 定义 与 使 用 。 


学 习 目标 


(1) 
CO) 
G3) 
(4) 


了 和 解 “ 分 治 ” 的 概念 ， 熟 悉 Python 的 代码 风格 。 

掌握 构建 自 定义 模块 的 方法 ， 掌 握 模 块 化 编程 的 程序 设计 方法 。 
理解 递归 函数 的 执行 过 程 ， 掌 握 递 归 函 数 的 编写 方法 。 

全 面 深入 地 了 解 内 建 模块 ， 并 能 运用 编程 的 方法 解决 实际 问题 。 


本 章 主要 讨论 程序 的 另 一 种 结构 : 函数 。 
针对 程序 流程 控制 而 言 ， 函 数 的 重要 性 与 选择 结构 和 循环 结构 是 一 样 的 。 函 数 允 许 程 
序 的 控制 在 不 同 的 代码 片段 之 间 切 换 。 函 数 的 重要 意义 在 于 可 以 在 程序 中 清晰 地 分 离 不 同 


的 任务 ， 


将 复杂 的 问题 分 解 为 若干 个 相对 简单 的 子 问题 ， 并 逐个 解决 ， 即 “分 而 治之 ”， 


或 称 “ 分 治 ”。 函 数 允 许 我 们 按照 这 样 的 方式 编写 或 阅读 程序 : 首先 关注 所 有 任务 ， 然 后 
关注 如 何 完 成 每 项 任务 。 换 言 之 ， 函 数 允 许 我 们 按照 “ 自 顶 向 下 、 逐 层 细 化 ”的 理念 编写 
程序 。 此 外 ， 函 数 还 为 代码 重用 提供 了 一 种 通用 机 制 。 


4.1 Python 代码 编写 规范 


Python 最 常用 的 编码 风格 还 是 PEP8， 先 简单 引用 一 下 《Python 之 禅 》 中 的 几 名 经典 


阐释 。 
(D) 
(2) 
G3) 
(9 

简洁 )。 
G5) 
(0 
(7) 
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优美 胜 于 丑陋 (Python 以 编写 优美 的 代码 为 目标 )。 

明了 胜 于 星 涩 (优美 的 代码 应 当 是 明了 的 ， 命 名 规范 ， 风 格 相 似 )。 

简洁 胜 于 复杂 (优美 的 代码 应 当 是 简洁 的 ， 不 要 有 复杂 的 内 部 实现 )。 

复杂 胜 于 凌乱 (即使 复杂 是 不 可 避免 的 ， 代 码 间 也 不 能 有 难 懂 的 关系 ， 要 保持 接口 





扁平 胜 于 嵌 套 (优美 的 代码 应 当 是 扁平 的 ， 不 能 有 太 多 的 嵌 套 )。 
间隔 胜 于 紧凑 (优美 的 代码 有 适当 的 间隔 ， 不 要 奢望 一 行 代码 解决 所 有 问题 )。 
可 读 性 很 重要 (优美 的 代码 是 可 读 的 )。 
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4.1.1 Python 代码 风格 


1. 避免 劣化 代码 

(1) 避免 只 用 大 小 写 来 区 分 不 同 的 对 象 。 

(2) 避免 使 用 容易 引起 混淆 的 名 称 ， 变 量 名 应 与 所 解决 的 问题 域 一 致 。 

(3) 不 要 害怕 变量 名 过 长 。 

2. 代码 中 添加 适当 注释 

(1) 行 注释 仅 注释 复杂 的 操作 、 算 法 ， 难 理解 的 技巧 ， 或 不 够 一 目 了 然 的 代码 。 

(2) 注释 和 代码 要 隔 开 一 定 的 距离 ， 无 论 是 行 注 释 还 是 块 注释 。 

(3) 给 外 部 可 访问 的 函数 和 方法 (无 论 是 否 简单 ) 添 加 文档 注释 ， 注 释 要 清楚 地 描述 方 





法 的 功能 ， 并 对 参数 、 返 回 值 和 可 能 发 生 的 异常 进行 说 明 ， 使 得 外 部 调用 的 人 仅 看 文档 字 
符 串 (docstring) 就 能 正确 使 用 。 





(4) 推荐 在 文件 头 中 包含 copyright 声明 、 模 块 描述 等 。 
(5) 注释 应 该 是 用 来 解释 代码 的 功能 、 原 因 、 想 法 的 ， 不 该 对 代码 本 身 进行 解释 。 
(6) 对 不 再 需要 的 代码 ， 应 该 将 其 删除 ， 而 不 是 将 其 注释 掉 。 


3. 适当 添加 空 行使 代码 布局 更 为 优雅 、 合 理 
(1) 在 一 组 代码 表达 完 一 个 完整 的 思路 之 后 ， 应 该 用 空白 行进 行 间隔 ， 推 荐 在 函数 定 


义 或 者 类 定义 之 间 空 两 行 ， 在 类 定义 与 第 一 个 方法 之 间 ， 或 需要 进行 语义 分 隔 的 地 方 空 一 


行 。 


空 行 是 在 不 隔断 代码 之 间 内 在 联系 的 基础 上 插入 的 。 

(2) 尽量 保证 上 下 文 语义 的 易 理 解 性 ， 一 般 是 调用 者 在 上 ， 被 调用 者 在 下 。 
(3) 避免 过 长 的 代码 行 ， 每 行 最 好 不 要 超过 80 个 字符 。 

(4) 不 要 为 了 保持 水 平 对 齐 而 使 用 多 余 的 空格 。 

4. 编写 函数 时 的 几 个 原则 


(1) 函数 设计 要 尽量 短小 ， 媒 套 层次 不 宜 过 深 。 
(2) 函数 声明 应 做 到 合理 、 简 单 、 易 于 使 用 ， 函 数 名 应 能 正确 反映 函数 的 大 体 功能 ， 


参数 设计 应 简洁 明 了， 参数 个 数 不 宜 过 多 。 


(3) 函数 参数 设计 应 考虑 向 下 兼容 。 
(4) 一 个 函数 只 做 一 件 事 ， 每 个 函数 都 应 有 一 个 单一 的 、 统 一 的 目标 ， 尽 量 保证 函数 


语句 粒度 的 一 致 性 。 


(5) 只 有 在 真正 必要 的 情况 下 才 使 用 全 局 变量 。 

(6) 不 要 改变 可 变 类 型 的 参数 ， 除 非 调用 者 希望 这 样 做 。 

(7) 避免 直接 改变 另 一 个 文件 模块 中 的 变量 。 

5. 将 常量 集中 到 一 个 文件 里 

Python 没有 提供 定义 常量 的 直接 方式 ， 一 般 有 两 种 方法 来 使 用 常量 。 

(1) 通过 命名 风格 来 提醒 使 用 者 该 变量 代表 的 意义 为 常量 ， 如 常量 名 所 有 字母 大 写 ， 
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用 下 划 线 连接 各 个 单词 ， 如 MAX NUMBER、PI 等 。 


母 ， 


(2) 通过 自 定义 的 类 实现 常量 功能 ， 常 量 要 求 符 合 两 点 ， 一 是 命名 必须 全 部 为 大 写字 
二 是 值 一 旦 绑 定 便 不 可 再 修改 。 





4.1.2 例子 说 明 





下 面 是 一 些小 例子 ， 用 于 简单 说 明 Python 的 语法 风格 。 
1. 交换 两 个 变量 
C 语言 代码 如 下 : 


inta=3，b=5; 
int tmp = a; 

到 一 by 

b = tmp; 


【 例 4-1】Python 风格 代码 : 


有 B= "by a 











注意 : Python 语法 风格 追求 的 是 对 Python 语法 的 充分 发 挥 ， 写 出 的 Python 代码 不 是 
看 着 像 C 或 Java 代码 。 
2. 不 应 过 分 使 用 技巧 
【 例 4-2】 逆 序 输出 字符 串 : 
-| | 
b = "abcde' 


Print (a[::-1]) 
print (b[::-1]) 


执行 以 上 代码 ， 输 出 结果 为 : 
[5, 4, 3, 2, 1] 

TE ee el 
2 


该 程序 的 作用 就 是 输出 逆序 的 a 和 b， 但 还 是 比较 临 涩 难 懂 。Python 语法 风格 追求 的 


是 充分 利用 Python 语法 ， 故 上 面 的 代码 可 写 为 : 


Se 
b= abcde'" 

print (list(reversed(a))) 
print (list(reversed(b))) 


3. 字符 串 格式 化 
本 书 2.3 节 介 绍 字符 串 时 曾 提 及 %s 的 用 法 。 一 般 来 说 ， 使 用 %s 进行 字符 串 的 格式 化 








比较 简洁 ， 例 如 下 面 的 例子 。 


.se 











【 例 4-3】 字 符 串 的 格式 化 输出 : 


name = "Tim'" 
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sex 三 “male" 
print ('Hello %s, your sex is %s !' $ (name, sex)) 
执行 以 上 代码 ， 输 出 结果 为 : 


Hello Tim, your sex is male ! 
>>> 


其 实 ，%s 是 比较 影响 可 读 性 的 ， 尤 其 是 存在 多 个 %s 时 ， 很 难看 清楚 哪个 占 位 符 对 应 
哪个 实 参 。 比 较 有 Python 风格 的 代码 如 下 : 

Value = {'name': 'Tim', 'sex': "male'} # 字 典 

print ('Hello %(name)s, your sex is %(sex)s !' gs value) 


使 用 % 占 位 符 的 形式 ， 依 旧 不 是 Python 最 推荐 的 ， 最 具 Python 风格 的 代码 如 下 : 


print ('Hello {name}, your sex is {sex} !'.format (name = 'Tim', sex = 
male')) 


str.format() 是 Python 最 为 推荐 的 字符 串 格式 化 方法 ，4.3.3 小 节 将 具体 介绍 。 
4. 过 多 的 if...elif...elif...else 应 使 用 字典 来 实现 

【 例 4-4】 判 断 数字 类 型 : 
n = int (input ("输入 数字 类 型 : ") ) 


if n == 0: 

print ("类 型 0") 
elif n == 1: 

print ("类 型 1") 
elif n == 2: 

print ("类 型 2") 
elses 


print ("其 他 类 型 ") 
执行 以 上 代码 ， 输 出 结果 为 : 


输入 数字 类 型 : 3 
其 他 类 型 
2 
上 述 代码 使 用 字典 来 实现 更 好 一 些 ， 更 加 简洁 明了 : 
def f(x): 
return{ 
0: "类 型 0"， 
"类型" 
2: "类 型 2"， 


}.get (x， "其 他 类 型 ") 
print (£f (5)) 


4.2 自 建 模块 


Python 的 自 建 模块 一 般 体现 为 函数 。Python 函数 有 如 下 特点 : 
@ 函数 是 组 织 好 的 、 可 重复 使 用 的 ， 用 来 实现 单一 或 相关 联 功 能 的 代码 段 。 
@ 函数 首先 关注 所 有 任务 ， 然 后 关注 如 何 完成 每 项 任务 。 函 数 类 型 有 两 种 : 有 返回 
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值 的 函数 和 仅仅 执行 代码 而 不 返回 值 的 函数 。 
@ 函数 能 提高 应 用 程序 的 模块 化 程度 和 代码 的 重用 性 。 
Python 提供 很 多 内 建 函 数 ( 亦 称 内 置 函数 )， 比 如 print0、int0、float0 等 ， 但 也 可 以 自 


己 创 建 函 数 ， 在 Python 中 称 为 用 户 自 定义 函数 。 
4.2.1 定义 一 个 函数 


用 户 可 以 自己 定义 一 个 函数 ， 用 以 完成 某 些 功能 。 函 数 定义 也 常常 称 为 函数 声明 。 以 


下 是 函数 定义 应 遵循 的 规则 : 


@ ”函数 定义 以 def 关键 字 开 头 ， 后 接 函 数 标识 符 名 称 和 圆 括号 0)， 最 后 是 冒号 ()。 
函数 命名 应 该 能 描述 函数 的 功能 ， 而 且 必须 符合 标识 符 的 命名 规则 。 

函数 的 形式 参数 ( 形 参 ) 必 须 放 在 圆 括号 中 。 

函数 的 第 一 行 语句 可 以 选择 性 地 使 用 文档 字符 串 ， 用 于 存放 函数 说 明 。 

函数 内 容 ( 语 句 块 ) 放 于 冒号 后 ， 每 条 语句 都 要 缩 进 相应 数量 的 空格 。 

以 retum [表达 式 ] 结 束 函 数 ， 选 择 性 地 返回 一 个 值 给 调用 者 。 不 带 表 达 式 的 retum 
相当 于 返回 None。 

定义 Python 函数 的 一 般 格式 如 下 : 


def functionName (parameter 1, parameter 2, parameter 3): 
functionBody 


def 是 define 的 缩写 ，functionName 是 由 用 户 命名 的 函数 名 ， 后 面 的 参数 表 中 可 以 有 








零 个 或 多 个 形 参 。 如 果 有 形 参 ， 则 函数 调用 时 ， 函 数 名 后 面 的 括号 中 一 般 要 提供 实际 参数 
( 实 参 )。 默 认 情况 下 ， 实 参 和 形 参 是 按 函 数 声明 中 定义 的 顺序 匹配 的 。 当 实 参 是 一 个 表达 
式 时 ， 先 要 计算 表达 式 的 值 ， 然 后 将 该 值 传递 给 形 参 。 相 邻 两 个 函数 定义 之 间 尽 量 用 空 行 
分 隔 。 
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【 例 4-5】 无 参 函 数 : 


def hello() : 
"This is a function without parameter." 
print ("Hello Python!") 

hello() 


执行 以 上 代码 ， 输 出 结果 为 : 
Hello Pythonl 
>>> | 


【 例 4-6】 带 参 函 数 (一 个 或 多 个 参数 ): 


def print wel (name): 
"This is a function with a parameter." 
print ("Welcome", name) 

print wel("Python") 

def rectangle area(wide, high): 
"This is a function with two parameters." 
return wide * high 

4 
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h=3 


print ("wide =", w, "high =", h, " area =", rectangle area(w, h)) 


执行 以 上 代码 ， 输 出 结果 为 : 
Welcome Python 

wide = 2 high = 3 area= 6 
>>> 


逮 注意 : 
@。 在 被 调用 前 ， 函 数 定义 必须 先 由 Python 解释 器 进行 处 理 。 
@ ”文档 宇 符 串 可 有 可 无 。 当 文档 字符 串 跨 多 行 时 ， 一 般 使 用 三 引号 作 定 界 符 。 


4.2.2 ”函数 调用 


定义 一 个 函数 ， 给 函数 一 个 名 称 ， 并 且 指 定 函数 里 包含 的 形 参 和 代码 块 结构 ， 这 个 函 
数 的 基本 结构 就 已 经 完成 ， 这 时 可 以 通过 另 一 个 函数 调用 执行 ， 也 可 以 直接 从 Python 命令 
提示 符 执行 。 

【 例 4-7】 定 义 函 数 : 


def printme( str ) : 坦 打 印 任何 传 入 的 字符 串 
print (str) 
return 
# 调 用 函数 
printme ("调用 自 定义 函数 !") 
printme ("再 次 调用 自 定义 函数 !") 


执行 以 上 代码 ， 输 出 结果 为 : 

调用 自 定义 画 数 ! 

| 8 ss， 

>>> 

直接 从 Python 命令 提示 符 也 可 以 调用 自 定义 函数 ， 执 行 过 程 如 下 : 
>>> printme (" 从 命令 行 直接 调用 自 定义 函数 !") 

从 命令 行 直 接 调 用 自 定义 函数 ! 


>>> | 
冯 注意 : 函数 是 可 以 谋 套 定义 的 ， 但 通常 情况 下 不 这 样 使 用 。 
【 例 4-8】 函 数 嵌 套 定 义 : 


def funl() : 

六 

def fun2(): 

print (x) 

fun2() 
# 调 用 自 定义 函数 
funl () 
执行 以 上 代码 ， 输 出 结果 为 : 


3 
>>> 
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4.2.3 按 引 用 传递 参数 


在 Python 中 ， 所 有 形 参 (变量 ) 都 是 按 引 用 传递 的 。 如 果 在 函数 里 修改 形 参 ， 那 么 在 调 
用 这 个 函数 的 函数 里 ， 实 参 ( 如 果 是 变量 的 话 ) 也 被 改变 了 。 


【 例 4-9】 函 数 参 数 的 传递 及 其 “副作用 ”: 


def printme( mylist ) : 
mylist.append([1,2,3]) 
print ("函数 内 的 值 : "，mylist) 
return 
# 调 用 printme 函数 
mylist = [5,15,25] 
printme( mylist ) 
print ("函数 外 的 值 : "，mylist) 
执行 以 上 代码 ， 输 出 结果 为 : 
画 数 内 的 值 : [5，15，25，[1，2，31]] 
画 数 外 的 值 : [5,15, 25, [1, 2, 3]] 
>>> 


第 2 章 中 曾 提 到 ， 参 数 的 传递 都 是 对 象 的 引用 ， 因 此 ， 实 参 mylist 与 形 参 mylist 引用 
的 是 同一 个 对 象 ， 它 们 的 地 址 是 一 样 的 。 正 因为 如 此 ，printme0 函 数 将 形 参 mylist 的 值 改 
变 了 ， 实 参 mylist 的 值 自然 也 就 改变 了 ( 即 产 生 了 “副作用 ”)。 这 一 点 与 C 语言 截然 不 
同 ， 使 用 时 应 特别 注意 。 
冰 注意 : 本 例 程 序 中 ， 形 参 和 实 参 恰巧 用 了 相同 的 标识 符 。 其 实 ， 即 使 使 用 不 同 的 标 
识 符 ， 得 到 的 结果 也 是 一 样 的 ， 读 者 不 妨 一 试 。 


4.2.4 参数 类 型 


以 下 是 调用 函数 时 可 使 用 的 参数 类 型 
@ 必需 参数 。 
@ ”关键 字 参 数 。 
@ 默认 参数 。 
@ 不 定 长 参数 。 
1. 必需 参数 
必需 参数 须 以 正确 的 顺序 传 入 函数 。 调 用 时 的 数量 必须 与 声明 时 的 一 样 。 例 如 调用 
printme() 函 数 时 ， 必 须 传 入 一 个 参数 ， 不 然 会 出 现 语法 错误 。 
【 例 4-10】 使 用 必需 参数 : 
def printme( str ): 
print (str) 
return 


# 调 用 printme 函数 
printme ("apple") 
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执行 以 上 代码 ， 输 出 结果 为 : 
apple 
>>> 


2. 关键 字 参 数 
使 用 关键 字 参 数 允 许 函 数 调 用 时 参数 的 顺序 与 声明 时 不 一 致 ， 因 为 Python 解释 器 能 
用 参数 名 匹配 参数 值 。 下 例 程序 在 调用 函数 printmeO 时 使 用 了 关键 字 参 数 。 
【 例 4-11】 使 用 关键 字 参 数 : 
def printme( str ): 
print (str) 
return 


# 调 用 printme 函数 


printme( str = "hello world" ) 


执行 以 上 代码 ， 输 出 结果 为 : 
hello world 


这 2 
【 例 4-12】 使 用 关键 字 参 数 的 实 参 不 需要 指定 顺序 : 
# 自 定义 函数 


def printme( name, sex ) : 
print ("名 字 : "，name) 
print ("性 别 : "，sex) 
return 

# 调 用 printme 函数 


printme( sex="female", name="Mary" ) 


执行 以 上 代码 ， 输 出 结果 为 : 


名 字 : Mary 
性 别 : ”female 
>>> 

3. 默认 参数 


调用 函数 时 ， 如 果 没 有 传递 参数 ， 则 Python 会 使 用 默认 参数 值 ， 如 下 例 中 ， 如 果 没 有 
传 入 age 参数 ， 则 使 用 默认 值 35。 
【 例 4-13】 使 用 默认 参数 : 


井 自 定义 函数 

def printme( name，age = 35 ) : 
print ("名 字 : "，name) 
print ("年 龄 : "，age) 
return 

# 调 用 printime 函数 

Printme ( age=50, name="Mary" ) 

printme( name="Mary" ) 


执行 以 上 代码 ， 输 出 结果 为 : 
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名 字 : Mary 
年 龄 : 50 
名 字 : Mary 
年 龄 : 35 
>>> 

4. 不 定 长 参数 


有 时 可 能 要 求 一 个 函数 能 处 理 比 当初 声明 时 更 多 的 参数 ， 这 些 参数 叫 作 不 定 长 参数 。 
与 上 述 两 种 参数 不 同 ， 函 数 声明 时 不 会 在 函数 名 后 面 的 括号 内 指定 参数 的 个 数 。 

基本 语法 如 下 : 

def functionname ([formal args,] *var args tuple ) : 


function suite 
return [expression] 


加 星 号 (*) 的 变量 名 会 存放 所 有 未 命名 的 变量 参数 。 如 果 在 函数 调用 时 没有 指定 参数 ， 
它 就 是 一 个 空 元 组 ， 这 意味 着 调用 这 类 函数 时 可 以 不 向 未 命名 的 变量 传递 参数 。 

【 例 4-14】 使 用 不 定 长 参数 : 

# 自 定义 函数 


def printme( argl, *variable ): 
print (argl) 
for var in variable: 
print (var) 
return 
# 调 用 printme 函数 
printme( 1 ) 
printme( 4，3，2 ) 


执行 以 上 代码 ， 输 出 结果 为 : 
有 
3 
2 


4.2.5 ”return 语句 


return [表达 式 ] 语 句 用 于 退出 函数 ， 并 选择 性 地 向 调用 者 返回 一 个 表达 式 。 如 前 所 述 ， 
不 带 参 数值 的 retur 语句 返回 的 是 None。 先 前 的 例子 都 没有 示范 如 何 返 回 数 值 ， 下 例 对 此 
做 了 示范 。 
【 例 4-15】 使 用 retum 语句 返回 数值 : 


# 自 定义 函数 

def sum( argl, arg2 ): 
total = argl + arg2 
return total 

# 调 用 sum 函数 

total = sum( 110, 20 ) 

print (total) 
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执行 以 上 代码 ， 输 出 结果 为 : 
130 
>>> 


4.2.6 ”变量 的 作用 域 


Python 中 的 变量 并 不 是 在 哪个 位 置 都 可 以 访问 的 ， 访 问 权限 取决 于 这 个 变量 是 在 哪里 
赋值 的 。 变 量 的 作用 域 决定 在 哪 一 部 分 程序 中 可 以 访问 哪个 特定 的 变量 。 根 据 变量 的 作用 
域 可 把 变量 分 为 两 种 基本 类 型 : 

@ 全 局 变量 。 

@ 局 部 变量 。 

1. 全 局 变量 和 局 部 变量 

定义 在 函数 内 部 的 变量 拥有 一 个 局 部 作用 域 ， 定 义 在 函数 外 部 的 变量 拥有 全 局 作用 
域 。 局 部 变量 只 能 在 其 被 声明 的 函数 内 部 访问 ， 而 全 局 变量 可 以 在 整个 程序 范围 内 访问 。 
调用 函数 时 ， 所 有 在 函数 内 声明 的 变量 名 都 将 被 加 入 到 作用 域 中 。 

【 例 4-16】 全 局 变量 与 局 部 变量 : 








total = 0 #total 在 这 里 是 全 局 变量 
# 自 定义 函数 
def sum( argl, arg2 ): 
total = argl + arg2 #total 在 这 里 是 局 部 变量 


print ("函数 内 是 局 部 变量 : "，total) 
return total 

# 调 用 sum 函数 

sum( 2, 5 ) 

print ("函数 外 是 全 局 变量 : "，total) 

执行 以 上 代码 ， 输 出 结果 为 : 

画 数 内 是 局 部 变量 : 7 

画 数 外 是 全 局 变量 : 0 


>>> 


2. 变量 的 作用 域 和 命名 空间 


变量 是 拥有 匹配 对 象 的 名 字 ( 标 识 符 )。 命 名 空间 是 一 个 包含 变量 名 称 ( 键 ) 和 它们 各 自 相 
应 的 对 象 ( 值 ) 的 字典 。 一 个 Python 表达 式 可 以 访问 局 部 命名 空间 和 全 局 命名 空间 里 的 变 
量 。 如 果 一 个 局 部 变量 和 一 个 全 局 变量 重 名 ， 则 局 部 变量 会 覆盖 全 局 变量 。 

每 个 函数 都 有 自己 的 命名 空间 ， 类 的 方法 的 作用 域 规则 与 一 般 函 数 的 一 样 (第 6 章 有 关 
于 类 的 介绍 )。 

Python 会 智能 地 猜测 一 个 变量 是 局 部 的 还 是 全 局 的 ， 它 假设 任何 在 函数 内 赋值 的 变量 
都 是 局 部 的 。 因 此 ， 如 果 要 在 一 个 函数 里 给 全 局 变量 赋值 ， 就 必须 使 用 global 语句 。 

global VarName 的 表达 式 会 告诉 Python，VarName 是 一 个 全 局 变量 ， 这 样 Python 就 
不 会 在 局 部 命名 空间 里 寻找 这 个 变量 。 

例如 ， 如 果 在 全 局 命名 空间 里 定义 一 个 变量 money， 再 在 函数 内 给 变量 money 赋值 ， 
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然后 Python 会 假定 money 是 一 个 局 部 变量 。 然 而 并 没有 在 访问 前 声明 一 个 局 部 变量 
money， 结 果 就 会 出 现 一 个 UnboundLocalError 错误 。 
【 例 4-17】 全 局 变量 标识 : 
a = 20 # 全 局 变量 
def Add() : 
global a # 全 局 变量 标识 
EL 
print (a) 
Add () 
print (a) 


执行 以 上 代码 ， 输 出 结果 为 : 
20 


2 
>>> 


读者 若 想 进 一 步 理解 作用 域 与 命名 空间 的 概念 ， 可 参见 本 书 6.1.3 节 。 
4.2.7 ”函数 与 递归 


递归 是 一 种 直接 或 间接 地 调用 自身 的 过 程 。 在 编程 时 ， 递 归 对 解决 一 大 类 问题 是 十 分 
有 效 的 。 

递归 的 特性 有 三 点 。 

(1) 必须 有 一 个 明确 的 结束 条 件 。 

(2) 每 次 进入 更 深 一 层 的 递归 时 ， 问 题 规模 相 比 上 次 递归 应 有 所 减少 。 

(3) 递归 效率 不 高 ， 递 归 层 次 过 多 会 导致 栈 溢出 (在 计算 机 中 ， 函 数 调用 是 通过 栈 这 种 
数据 结构 实现 的 ， 每 当 进入 一 个 函数 调用 ， 栈 就 会 加 一 层 栈 帧 ， 每 当 函 数 返 回 ， 栈 就 会 减 
一 层 栈 帧 。 因 为 栈 的 大 小 不 是 无 限 的， 所 以 ， 递 归 调 用 的 次 数 过 多 ， 会 导致 栈 溢出 )。 

下 面 我 们 展示 一 下 如 何 用 递归 来 解决 实际 问题 。 


1. 阶乘 


正 整 数 的 阶乘 n! 是 所 有 不 大 于 该 数 的 正 整数 之 积 。0 的 阶乘 定义 为 0。 
例如 5!= 5x4x3x2x1， 得 到 的 积 是 120， 即 5!=120。 对 于 正 整 数 n，nl= nx(n-1)x(n- 
2)x...x1， 也 可 以 表示 为 递归 的 形式 : 
n!l=nx(n-1)x(n-2)x(n-3)x(n-4)x...x2x1 
=nx(n-1)! 
【 例 4-18】 阶 乘 的 递归 实现 : 
def Fac(num) : 
if num <= 1: return 1 


return num * Fac(num-1) 
print (Fac (5)) 


执行 以 上 代码 ， 输 出 结果 为 : 
5 
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2. 斐 波 那 契 数列 
第 3 章 3.4.6 节 曾 介绍 了 斐 波 那 契 数列 。 实 际 上 ， 该 数列 是 一 种 递归 数列 。 当 n>1 
时 ， 该 数列 第 n 项 等 于 其 前 面 两 项 之 和 ， 所 以 ， 裴 波 那 契 数列 可 以 写成 如 下 的 递归 形式 : 


四 1 n=0.1 
四 F(n—D+F(n—2) n>1 


【 例 4-19】 斐 波 那 契 数 列 递归 算法 : 


def item( num ) : 


if num == 0 : 
-三 守 
elif num == 1: 
fi=1 
SSses 
fi = item ( num - 1) + item (num -2) 
return fi 


def Fib( n ): 
i=0 
while i < n: 
print (item(i),end="',') 
i+=1 
Fib( 8 ) 
执行 以 上 代码 ， 输 出 结果 为 : 
1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 
>>> 
以 上 递归 方法 的 递归 次 数 太 多 时 ， 效 率 低下 ， 所 以 通常 可 以 采用 递 推算 法 ， 通 过 列表 
来 实现 。 
【 例 4-20】 斐 波 那 契 数 列 递 推算 法 : 
def Fib (num) : 
mmm 递 推算 法 "mm 
fib = [1] # 用 列表 保存 中 间 结 果 ， 初 始 值 为 1 
for i in range (num): 
if i < 2:fib.append(i + 1) 
else:fib.append (sum (fib[-2:])) 
return fib 
print (Fib (10)) 


执行 以 上 代码 ， 输 出 结果 为 : 
Dy 2 So Dl Zi dA 357 .89 
>>> | 


3. 整数 因子 分 解 


大 于 1 的 正 整数 n 都 可 以 分 解 为 n = x1*x2*...*xm。 例 如 : 当 n=12 时 ， 共 有 8 种 不 同 
的 分 解 式 : 
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2 
1 
1 
2 
4 
12 
2 


对 于 给 定 的 正 整数 n， 要 求 计算 n 共有 多 少 种 不 同 的 分 解 式 ， 这 就 是 所 谓 的 “整数 因 


6x2 
4x3 
3x4 
3x2x2 
2x6 
2x3x2 
2x2x3 


[ee 





子 分 解 ”。 
【 例 4-21】 正 整数 35 的 因子 分 解 : 


count=0 
def fac(num) : 


.fo 


i 








global count 
n= "nm 二 二 
A=[] 
for i in range(2,n): 
if num % i==0: 
A.append (i) 
l=len (A) 
for i in range(0,1): 
if int (num/A[i])==1: 
count += 1 
slses 
fac(int (num/A[i])) 
return count 
name ==" main ": 


print (fac(35)) 


执行 以 上 代码 ， 输 出 结果 为 : 


3 


>2>> 


因为 整数 35 有 三 种 因子 分 解 方法 ， 即 35=35、35=5x7、35=7x5， 所 以 输出 结果 为 3。 
注意 : 关于 语句 过 _name 一“ main ” 的 几 点 说 明 : 


一 般 来 说 ， 用 Python 写 的 文件 既 可 以 自身 运行 ， 又 可 以 作为 模块 ， 被 其 他 的 程序 
调用 。 

当 程 序 自身 运行 时 ， 其 _name 的 值 就 是 字符 串 ” main ”; 如 果 是 被 其 他 程序 
调用 ， 那 么 其 _name 的 值 就 不 再 是 字符 串 ”_ main ”。 这 个 判断 的 作用 就 是 使 
其 后 的 代码 块 只 有 在 自身 运行 的 情况 下 才 执 行 ， 如 果 只 是 被 调用 ， 那 么 就 不 会 执 
行 了 。 

简单 地 说 ， 这 条 语句 的 主要 功能 在 于 保留 了 一 个 脚本 独立 运行 的 能 力 ， 又 同时 使 
该 脚本 的 功能 函数 与 类 能 够 成 为 其 他 脚本 的 拓展 (在 6.3.3 小 节 中 ， 还 要 对 此 做 详 
细 的 介绍 )。 

这 条 语句 通常 可 以 用 来 给 一 个 模块 做 测试 ， 在 项 目 整 体 运行 的 时 候 测试 的 代码 将 
不 会 被 执行 。 
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4. 快速 排序 

快速 排序 (quicksort) 是 对 冒 泡 排序 的 一 种 改进 ， 由 C. A. R. Hoare 在 1962 年 提出 。 它 的 
基本 思想 是 : 通过 一 趟 排序 将 要 排序 的 数据 分 割 成 独立 的 两 部 分 ， 其 中 一 部 分 的 所 有 数据 
比 另 外 一 部 分 的 所 有 数据 都 要 小 ， 然 后 再 按 此 方法 对 这 两 部 分 数据 分 别 进行 快速 排序 。 

【 例 4-22】 人 快速 排序 : 


def quicksort (array) : 





mmw 快 速 排序 算法 "mm 
less = [] 
more = [] 


if len(array) <= 1: 
return array 
p = array.pop() 
for x in array: 
二 
more.append (x) 
elses 
less.append (x) 
return quicksort (less) + [p] + quicksort (more) 
arrayl = [21,32,42,53,34,25,57,54,78,89] 
print (quicksort (arrayl)) 


执行 以 上 代码 ， 输 出 结果 为 : 
[2lr 25r 327 S34 27 33 S54r. Sie 787 B89) 
>>> | 


5. 归并 排序 

归并 排序 使 用 二 分 法 ， 其 归根 到 底 的 思想 是 分 治 。 用 列表 存储 数据 ， 将 其 不 停 地 分 为 
左边 和 右边 两 份 ， 然 后 依 此 递归 地 分 下 去 ， 再 将 它们 按照 两 个 有 序列 表 合并 起 来 。 

【 例 4-23】 归 并 排序 : 


def mergeSort (list1): 
if len(1istl) <= 1: 
return 1ist1 
mid = int (len(list1)/2) 
left = mergeSort (list1[0:mid]) 
right = mergeSort (listl [mid:len (list1)]) 
return merge (left, right) 


def merge(I7 r): 
== 
= 
while j < len(1) and i < len(r): 
LT Se 
c.append (r [i]) 
= 
Slse: 
c.append (1[j]) 
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T+ 
for i in (1[j:] if i == len(r) else r[i:]): 
c.append (i) 
return c 
if name ==" main ': 
TE 1 00020 oN 
print (mergeSort (list2)) 


执行 以 上 代码 ， 输 出 结果 为 : 


[=127 =4y 0 lr 3r 197 56r 82] 
>>> 


4.2.8 和 帮 代 器 与 生成 器 

1. 迭代 器 

迭代 器 (iteratoD 是 Python 最 强大 的 功能 之 一 ， 是 访问 集合 元 素 的 一 种 方式 。 和 迭代 器 是 
一 个 可 以 记 住 遍历 位 置 的 对 象 。 和 迭代 器 对 象 从 集合 的 第 一 个 元 素 开 始 访问 ， 直 到 所 有 的 元 
素 被 访问 完 为 止 。 和 迭代 器 只 能 向 前 ， 不 会 后 退 。 和 迭代 器 有 两 个 基本 的 方法 : iter0 和 
next()。 字 符 串 、 列 表 或 元 组 对 象 都 可 用 于 创建 迭代 器 。 

【 例 4-24】 达 代 器 示例 : 

1ist=["12", "23", "34", "45"] 

让 = iter(list) # 创 建 迭代 器 对 象 

print (next (it)) # 输 出 迭代 器 的 下 一 个 元 素 

print (next (it)) # 输 出 迭代 器 的 下 一 个 元 素 

print (next (it)) # 输 出 迭代 器 的 下 一 个 元 素 

print (next (it)) # 输 出 迭代 器 的 下 一 个 元 素 

String = "hello" 

st = iter(string) 间 创 建 和 迭代 器 对 象 

Print (next (st)) # 输 出 和 迭代 器 的 下 一 个 元 素 

print (next (st)) # 输 出 和 迭代 器 的 下 一 个 元 素 

tupl = ('Google', 'Run', 1997, 2017) 

tu = iter(tupl) ## 创 建 选 代 器 对 象 

Print (next (tu) ) “# 输 出 迭代 器 的 下 一 个 元 素 

print (next (tu) ) “# 输 出 迭代 器 的 下 一 个 元 素 


执行 以 上 代码 ， 输 出 结果 为 : 
12 


> 
注意 : 挝 代 器 对 象 可 以 使 用 常规 的 for 语句 进行 遍历 。 
【 例 4-25】 用 for 循环 遍历 迭代 器 : 
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| ee a he || 
LE ter(LLSte) # 创 建 选 代 器 对 象 
Or RE 

print (x, end=" ") 


string = "hello" 
st = iter(string) # 创 建 迭 代 器 对 象 
or x Ln SE 

print (x, end=" ") 


tupl = ('Google', "Run'"，2017，2018) 
tu = iter(tupl) # 创 建 迭代 器 对 象 
On 

print (x, end=" ") 


执行 以 上 代码 ， 输 出 结果 为 : 
12 23 34 45 六 e 下 至 o Google Run 2017 2018 
>>> | 


注意 : 也 可 以 在 循环 中 使 用 next 函数。 
【 例 4-26】 用 while 循环 遍历 迭代 器 : 


string = "hello" 
st = iter(string) # 创 建 迭 代 器 对 象 
i=0 # 循 环 控制 变量 
while (i < 5): 
print (next(st),end=" ") 
= 
执行 以 上 代码 ， 输 出 结果 为 : 


he 1 下， 竹 
>>> 


2. 生成 器 


在 Python 中 ， 使 用 yield 的 函数 被 称 为 生成 器 (generator)。 跟 普通 函数 不 同 的 是 ， 生 成 
器 是 一 个 返回 迭代 器 的 函数 ， 只 能 用 于 和 迭代 操作 。 可 以 更 简单 地 理解 : 生成 器 就 是 一 个 迭 
代 器 。 
在 调用 生成 器 运行 的 过 程 中 ， 每 次 遇 到 yield 时 ， 函 数 会 暂停 并 保存 当前 所 有 的 运行 
信息 ， 返 回 yield 的 值 ， 并 在 下 一 次 执行 next() 方 法 时 从 当前 位 置 继续 运行 。 
【 例 4-27】 生 成 器 示例 : 
def fib (n) : # 生 成 器 函数 - 斐 波 那 契 
a, b, counter = 0, 1, 0 
while True: 
if (counter > n): 
return 
yield a 
a bp =D at Dp 
counter + 
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Els) #E 是 一 个 迭代 器 ， 由 生成 器 返回 生成 
i=0 
while i < 15: 
print (next (f), end=" ") 
=+1 


执行 以 上 代码 ， 输 出 结果 为 : 
oT 2 3 5 132134 06 09 14233377 610 
>>> | 


yield 的 作用 就 是 把 一 个 函数 变 成 一 个 生成 器 函数 ， 带 有 yield 的 函数 不 再 是 一 个 普通 
函数 ，Python 解释 器 会 将 其 视 为 一 个 生成 器 函数 。 

生成 器 函数 和 普通 函数 的 执行 流程 不 一 样 。 函 数 是 顺序 执行 ， 遇 到 retum 语句 或 者 执 
行 完 最 后 一 条 语句 就 返回 。 而 变 成 生成 器 的 函数 ， 在 每 次 调用 next() 的 时 候 执行 ， 遇 到 
yield 语句 返回 ， 再 次 执行 时 从 上 次 返回 的 yield 语句 处 继续 执行 。 

如 果 没有 “yield a” 语 句 ，fib() 函 数 就 不 是 一 个 生成 器 函数 ， 就 无 法 返回 迭代 器 ， 因 
而 while 循环 中 的 nextO 函 数 就 无 法 使 用 ， 从 而 打印 错误 信息 “TypeError: “NoneType” 


object is not an iterator”。 


4.2.9 自 定 义 模块 


Python 脚本 可 以 在 其 集成 开发 环境 IDE 下 运行 ， 但 如 果 从 IDE 中 退出 再 进入 ， 那 么 定 
义 的 所 有 方法 和 变量 都 会 消失 。 为 此 Python 提供 了 一 个 办 法 ， 把 这 些 定义 存放 在 文件 中 ， 
为 一 些 脚本 或 者 交互 式 的 解释 器 使 用 ， 这 个 文件 被 称 为 模块 。 这 一 概念 在 第 2 章 的 2.1 节 
最 后 已 经 提 及 。 
模块 具有 如 下 特点 : 
@ ”模块 让 使 用 者 能 够 有 逻辑 地 组 织 自己 的 Python 代码 段 。 
@ ”把 相关 的 代码 分 配 到 一 个 模块 里 能 让 代码 更 好 用 、 更 易 懂 。 
@ ”模块 也 是 Python 对 象 ， 具 有 随机 的 名 字 属 性 用 来 绑 定 或 引用 。 
@ ”模块 是 一 个 包含 所 有 已 经 定义 的 函数 和 变量 的 文件 ， 模 块 里 面 也 能 够 包含 可 执行 
代码 。 
@ ”模块 的 后 级 名 是 .py， 模 块 可 以 被 别 的 程序 引入 ， 以 使 用 该 模块 中 的 函数 等 功能 。 
这 也 是 使 用 Python 标准 库 的 方法 。 
一 个 叫 function 的 模块 里 的 Python 代码 一 般 都 能 在 一 个 叫 function.py 的 文件 中 找到 。 
【 例 4-28】 一 个 简单 的 模块 function.py: 
def Add( argl, arg2 ) : 
total = argl + arg2 
return total 
def Sub( argl, arg2 ) : 
diff = argl - arg2 
return diff 
def printme( str ): 


print (str) 
return 
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1. import 语句 
如 果 需 要 使 用 Python 源 文件 ， 只 需 在 另 一 个 源 文件 里 执行 import 语句 ， 语 法 如 下 : 
import modulel[, module2[,... moduleN]] 


当 解 释 器 遇 到 import 语句 时 ， 模 块 当前 搜索 路 径 就 会 被 导入 到 Python 解释 器 。 搜 索 
路 径 是 一 个 解释 器 先进 行 搜索 的 所 有 目录 的 列表 。 如 果 想 要 导入 模块 functionpy， 需 要 把 
import 命令 放 在 脚本 的 顶端 。 例 如 : 

import function # 导 入 模块 function.py 

function.printme ("hello Python") # 调 用 模块 里 包含 的 函数 ， 不 能 漏 写 “function.” 

执行 以 上 代码 ， 输 出 结果 为 : 


hello Python 
>>> | 





2.，from...import 语句 

Python 的 from...import 语句 让 使 用 者 从 模块 中 导入 一 个 指定 的 部 分 到 当前 命名 空间 
其 语法 如 下 : 

from modname import namel[, name2[, ... nameN]] 


例如 ， 如 果 需 要 导入 模块 function 中 的 Add 函数 ， 则 可 使 用 语句 : 
from function import Add 


这 个 声明 不 会 把 整个 function 模块 导入 到 当前 的 命名 空间 中 ， 它 只 会 将 function 里 单 
个 的 Add 函数 导入 到 执行 这 个 声明 的 模块 的 全 局 符号 表 中 。 如 : 

from function import printme，Sub，Rdd # 仅 导入 printme、Sub、Adq 这 三 个 函数 

from function import * ， 井 导 入 function 中 的 全 部 对 象 (包括 函数 、 类 等 ) 

应 尽量 少 用 from module import *， 因 为 判定 一 个 特殊 的 函数 或 属性 是 从 哪 来 的 有 些 困 
难 ， 并 且 会 使 调试 和 重 构 更 困难 。 


3. 定位 模块 


当 导 入 一 个 模块 时 ，Python 解析 器 对 模块 位 置 的 搜索 顺序 是 : 

@ 当前 目录 。 

@ ”如 果 不 在 当前 目录 ，Python 则 搜索 在 shell 变量 PYTHONPATH 下 的 每 个 目录 。 

@ ”如 果 找 不 到 ，Python 会 察看 默认 路 径 。Linux 下 的 默认 路 径 一 般 为 /usr/local/lib 
/python/。Windows 下 的 模块 搜索 路 径 存 储 在 system 模块 的 sys.path 变量 中 ， 如 
图 4-1 所 示 。 变 量 里 包含 当前 目录 、PYTHONPATH， 以 及 由 安装 过 程 决定 的 默 
认 目 录 。 

4. PYTHONPATH 变量 


作为 环境 变量 ，PYTHONPATH 由 装 在 一 个 列表 里 的 许多 目录 组 成 。PYTHONPATH 
的 语法 和 shell 变量 PATH 是 一 样 的 。 
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| Fie Edit Shell pebog opions widow Hep 

>>> import sys 

>>> sys.path 

['', 'C:\\Windows\\system32', 'C:\\Users\\Administrator\\AppData\\ 
Local\\Programs\\Python\\Python35-32\\Lib\\idlelib', 'C:\\Users\\A 
dministrator\\AppData\\Local\\Programs\\Python\\Python35-32\\1ib\\ 
site-packages\\pynlpl-1.1.5-py3.5.egg', 'C:\\Users\\Administrator\ 
\AppData\\Local\\Programs\\Python\\Python35-32\\1ib\\site-packages 
\\rdflib-4.2.2-py3.5.egg', 'C:\\Users\\Administrator\\AppData\\Loc 
al\\Programs\\Python\\Python35-32\\l1ib\\site-packages\\httplib2-0, 
10.3-py3.5.egg', 'C:\\Users\\Administrator\\AppData\\Local\\Progra 
ms\\Python\\Python35-32\\l1ib\\site-packages\\nltk-3.2.2-py3.5.egg' 
1 'C:\\Users\\Aqdministrator\\AppData\\Local\\Programs\\Python\\Pyt 
hon35-32\\lib\\site-packages\\six-1.10.0-py3.5.egg', 'C:\\Users\\A 
dministrator\\AppData\\Local\\Programs\\Python\\Python35-32\\1ib\\ 
site-packages\\textblob de-0.4.2-py3.5.egg', 'C:\\Users\\Administr 
ator\\AppData\\Local\\Programs\\Python\\Python35-32\\lib\\site-pac 
kages\\textblob-0.12.0-py3.5.egg', 'C:\\Users\\Administrator\\AppD 
ata\\Local\\Programs\\Python\\Python35-32\\lib\\site-packages\\pyp 
inyin-0.19.0-py3.5.egg', 'C:\\Users\\Administrator\\AppData\\Local 
\\Programs\\Python\\Python35-32\\python35.zip', 'C:\\Users\\Admini 。 





4-1 Windows 中 的 模块 路 径 示 例 
在 Windows 系统 中 ， 典 型 的 PYTHONPATH 如 下 : 


set PYTHONPRATH=c:\python34\1ib 


在 Linux 系统 中 ， 典 型 的 PYTHONPATH 如 下 : 


set PYTHONPATH=/usr/local/lib/python 


4.3 标准 模块 


Python 本 身 自 带 一 些 标准 的 模块 库 ， 有 些 模块 直接 被 构建 在 解析 器 里 ， 这 些 虽然 不 是 
Python 语言 内 建 的 功能 ， 但 是 它 却 能 很 高 效 地 使 用 ， 甚 至 是 系统 级 调用 也 没 问 题 。 这 些 组 
件 会 根据 不 同 的 操作 系统 进行 不 同形 式 的 配置 ， 比 如 ，winreg 这 个 模块 就 只 会 提供 给 
Windows 系统 。 


4.3.1 内 建 函 数 


Iange0 函 数 为 内 建 函 数 的 一 种 ， 前 面 已 经 讲 过 ， 此 处 不 再 獒 述 。 
部 分 内 建 函 数 如 表 4-1 所 示 。 


表 4-1 Python 的 部 分 内 建 函 数 


内 建 函 数 


将 


intO 
chr0) 


int(2.34) 结果 是 2 
chr(67) 结果 是 C 
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续 表 
内 建 函 数 实 _ 例 
ord0) ord(“B”) 结果 是 66 
round() round(67.12345,2) 结果 是 67.12 





4.3.2 读 取 键 盘 输入 


Python 用 于 读 取 键盘 输入 的 内 建 函数 是 input0， 前 面 已 多 次 用 到 ， 它 是 基本 的 IO 函 
数 ， 用 于 从 标准 输入 设备 读 入 一 行文 本 (默认 的 标准 输入 设备 是 键盘 )。input0 函 数 可 以 接收 
一 个 Python 表达 式 作 为 输入 ， 并 将 运算 结果 返回 。 

【 例 4-29】 基 本 输入 输出 : 

str = input (" 请 输入 内 容 : ") 

print ("你 输入 的 内 容 是 : "，str) 

执行 以 上 代码 ， 输 出 结果 为 : 

请 输入 内 容 : 早 安 ， 天 津 

你 输入 的 内 容 是 : ” 早 安 ， 天 津 

>>> 
色 注意 : input0 通 数 只 能 返回 字符 串 ， 如 需 转换 为 其 他 类 型 ， 可 以 使 用 相应 的 转换 函 

数 ， 如 int()、float0 等 。 


4.3.3 ”输出 到 屏幕 


Python 有 两 种 输出 值 的 方式 : print0 函 数 和 表达 式 语句 。 

最 简单 的 输出 方法 是 用 print0 函 数 ， 可 以 给 它 传递 零 个 或 多 个 用 逗号 隔 开 的 表达 式 。 
此 函数 把 传递 的 表达 式 转换 成 一 个 字符 串 表 达 式 ， 并 将 结果 写 到 标准 输出 设备 (屏幕 ) 上 。 

【 例 4-30】 基 本 输出 : 


print ("hello,Python") 


执行 以 上 代码 ， 输 出 结果 为 : 
ss 
>>> 


如 果 使 用 者 希望 将 输出 的 值 转换 成 字符 串 ， 可 以 使 用 format0 或 repr0) 函 数 。 
@ ”format(0) 函 数 : 返回 一 个 用 户 易 读 的 表达 形式 。 
@ repr() 函 数 : 产生 一 个 解释 器 易 读 的 表达 形式 。 


1. format() 函 数 的 使 用 


如 果 希 望 输出 的 形式 更 加 多 样 ， 可 以 使 用 str.format0 函 数 来 格式 化 输出 内 容 。 现 通过 
几 个 例子 来 说 明 str.format0 函 数 的 用 法 。 
【 例 4-31】 简单 的 格式 化 输出 : 


print('{}: "™{}!"'.format('hello', 'Python')) 
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执行 以 上 代码 ， 输 出 结果 为 : 
hello: "Python!" 
> 


注意 :， 花 括号 及 其 里 面 的 字符 ( 称 作 格式 化 字段 ) 将 会 被 format() 中 的 参数 葵 换 。 在 花 
括号 中 可 以 放 入 数字 ， 用 于 指向 传 入 对 象 在 format0 中 的 位 置 ， 如 下 例 所 示 . 


【 例 4-32】 带 有 对 象 传 入 顺序 的 格式 化 输出 : 


print('{0} 和 {1}"'.format ('Google', 'Apple')) 
print('{1} 和 {0}"'.format ('Google', 'Apple')) 


执行 以 上 代码 ， 输 出 结果 为 : 
Google 和 Apple 

Apple 和 Google 

>>> 


如 果 在 formatO 中 使 用 关键 字 参数 ， 那 么 它们 的 值 会 指向 使 用 该 名 字 的 参数 。 
【 例 4-33】 使 用 关键 字 参 数 的 格式 化 输出 : 


print (' {name} 网 址 : {site}'.format (name=' 百 度 '，site='www.baidu.com')) 


执行 以 上 代码 ， 输 出 结果 为 : 
百度 网 址 : www.baidu.com 
>>> 


注意 : 位 置 及 关键 字 参 数 可 以 任意 结合 。 
【 例 4-34】 同 时 使 用 对 象 传 入 顺序 和 关键 字 参 数 的 格式 化 输出 : 


print(' 网 站 {0}，{1}, 和 {other}。'.format('baidu', 
"meituan' other='taobao') ) 
执行 以 上 代码 ， 输 出 结果 为 : 


网 站 baidu，meituan， 和 taobao。 
>>> 


注意 :， 可 选项 … 和 格式 标识 符 可 以 跟着 字段 名 ， 这 就 允许 对 值 更 好 地 进行 格式 化 。 


下 面 的 例子 将 圆周 率 PI 保留 到 小 数 点 后 三 位 。 
【 例 4-3S】 使 用 格式 标识 符 的 格式 化 输出 : 


import math 
print (， PI 的 值 近似 是 {0: .2f}。' .format (math.pi)) 


执行 以 上 代码 ， 输 出 结果 为 : 
| PI 的 值 近似 是 3.14。 
>>> 


在 “:” 后 传 入 一 个 整数 ， 可 以 保证 该 域 至 少 有 这 么 多 的 宽度 ， 在 美化 表格 时 很 有 用 。 
【 例 4-36】 表 格式 格式 化 输出 : 
tables = {'baidu': 1，'meituan': 2, "taobao': 3} 
for name, number in tables.items(): 
print('{0:8} = > {1:8d}".format (name, number)) 
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执行 以 上 代码 ， 输 出 结果 为 : 


Le oo = 二 3 


党 
m 
全 
D 
EE 
1 
| 
1 
| 
1 
Y 


baidu  ----- > 1 


本 书 2.3 节 已 提 到 ， 使 用 % 操 作 符 也 可 以 实现 字符 串 的 格式 化 :，% 前 面 的 字符 串 与 C 
语言 中 printf0 函 数 的 格式 化 字符 串 完全 相同 ; % 后 面 的 各 项 (超过 一 项 时 用 元 组 ) 与 前 面 的 
格式 化 操作 符 一 一 匹配 后 ， 返 回 格式 化 后 的 字符 串 。 现 再 举 一 例 。 

【 例 4-37】 使 用 % 操 作 符 的 格式 化 输出 : 

import math 

print (' 常 量 PI 的 值 近似 是 : $4.2f。' % math.pi) 


执行 以 上 代码 ， 输 出 结果 为 : 


常量 PI 的 值 近 似 是 : 3.14。 
>>> 











通 注意 : “4” 表示 输出 一 共有 4 位 ，“2” 表 示 小 数 点 后 有 2 位 数字 。 但 这 种 是 旧 格 
式 ，Python 推荐 使 用 str.format()。 


2. repr() 函 数 的 使 用 


Iepr0 将 字符 串 转化 为 供 解释 器 读 取 的 形式 。repr0 的 输出 对 Python 比较 友好 ， 返 回 的 
是 一 个 对 象 的 “官方 ”字符 串 表示 。 

【 例 4-38】repr0 函 数 示例 : 

print (repr('Hello,Python.')) 


print (repr(0.1)) 
19 3:25 


y= 20*34 
Ss = Ls "+ FOBE(z) + INIY Ls "+ repr(v) 
print (s) 


print (repr('hello,Python\n')) 

Print (repr((x, y, ('word', 'world')))) 
print (repr('Hello')) 

obj="'Hello, Python." 

print (obj==eval (repr (obj))) 


执行 以 上 代码 ， 输 出 结果 为 : 
'Hello, Python.' 

he 

x is 42.25111Iy is 680 

'hello, PythonNn' 

人 (4225255680CTwWOTdYWOrLGO 
"Hel1lo" 

True 

>>> 


4.3.4 内 建 模块 


Python 标准 库 中 提供 了 不 少 内 建 模 块 ， 这 些 内 建 模块 中 又 包含 了 很 多 实用 的 内 建 函 
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数 。 下 面 是 使 用 Python 标准 库 中 模块 的 几 个 例子 。 


1. 时 间 (time) 模 块 
Python 程序 能 用 很 多 方式 处 理 日 期 和 时 间 ， 其 中 转换 日 期 格式 是 一 个 常见 的 功能 。 


Python 提供 的 time 和 calendar 模块 可 以 用 于 格式 化 日 期 和 时 间 。 时 间 间 隔 是 以 秒 为 单位 的 
浮 点 小 数 ， 每 个 时 间 惟 都 是 用 从 1970 年 1 月 1 日 0 时 0 分 0 秒 至 今 经 过 多 长 时 间 来 表示 
的 。Python 的 time 模块 下 有 很 多 函数 可 以 转换 常见 的 日 期 格式 ， 如 函数 time.timeO 用 于 获 
取 当 前 时 间 惟 。 


【 例 4-39】time 模块 的 使 用 : 


import time # 引 入 time 模块 
ticks = time.time() 


print (" 当 前 时 间 惟 为 :"，ticks) 
执行 以 上 代码 ， 输 出 结果 为 : 


当前 时 间 惟 为 : 1501155583.150937 
人 


time 模块 包含 不 少 内 建 函 数 ， 既 有 与 时 间 处 理 相关 的 函数 ， 也 有 转换 时 间 格 式 的 函 








数 ， 如 表 4-2 所 示 。 


表 4-2 time 模块 的 部 分 内 建 函 数 


函数 及 描述 
time.altzone 
返回 格林 尼 治 西部 的 夏令 时 地 区 的 偏 移 秒 数 。 如 果 该 地 区 在 格林 尼 治 东部 则 会 返回 负 值 (如 西 
欧 ， 包 括 英国 )。 对 夏令 时 启用 地 区 才能 使 用 
time.asctime([tupletime]) 
接受 时 间 元 组 并 返回 一 个 可 读 的 形式 为 例如 “Tue Dec 11 18:07:14 2008”(2008 年 12 月 11 日 
周二 18 时 07 分 14 秒 ) 的 24 个 字符 的 字符 串 
time.clockO 
用 以 浮 点 数 计算 的 秒 数 返回 当前 的 CPU 时 间 。 用 来 衡量 不 同 程序 的 耗 时 ， 这 个 函数 比 
time.timeO 更 有 用 
































time.ctime([secs]) 


作用 相当 于 asctime(localtime(secs))， 未 给 参数 相当 于 asctimeO 





time.gmtime([secs]) 
接收 时 间 戳 (从 1970 起 算 经 过 的 浮 点 秒 数 ) 并 返回 格林 尼 治 天 文 时 间 下 的 时 间 元 组 (假设 为 D。 
注 : ttm isdst 始终 为 0 

















time.localtime([secs] 
接收 时 间 戳 (从 1970 起 算 经 过 的 浮 点 秒 数 ) 并 返回 当地 时 间 下 的 时 间 元 组 t(ttm_ isdst 可 取 0 或 
1， 取 决 于 当地 当时 是 不 是 夏令 时 ) 
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time.mktime(tupletime) 
接受 时 间 元 组 并 返回 时 间 戳 (从 1970 起 算 经 过 的 浮 点 秒 数 ) 
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续 表 


序号 函数 及 描述 


time.sleep(secs) 


推迟 调用 线程 的 运行 ，secs 指 秒 数 





time.strftime(fmt[,tupletime]) 























接收 一 个 时 间 元 组 ， 并 返回 以 可 读 字符 串 表 示 的 当地 时 间 ， 格 式 由 fmt 决定 
0 time.strptime(str,fmt="%a %b %d %H:%M:%S %6Y 7) 
根据 fimt 的 格式 把 一 个 时 间 字 符 串 解 析 为 时 间 元 组 
time.time( ) 
返回 当前 时 间 的 时 间 戳 (从 1970 起 算 经 过 的 浮 点 秒 数 ) 
入 time.tzsetO 


一 且 
下 


历 和 





根据 环境 变量 TZ 重新 初始 化 时 间 相关 设置 


2. 日 历 (calendar) 模 块 


此 模块 中 的 函数 都 是 与 日 历 相 关 的 ， 例 如 打印 某 月 的 字符 月 历 。 这 里 我 们 约定 ， 星 期 
默认 的 每 周 第 一 天 ， 星 期 天 是 默认 的 最 后 一 天 。calendar 模块 有 很 多 方法 用 来 处 理 年 
月 历 ， 例 如 打印 某 月 的 月 历 。 

【 例 4-40】 获 取 某 月 日 历 : 


import calendar 

cal = calendar.month (2017, 3) 
print ("以 下 输出 2017 年 3 月 份 的 日 历 :") 
print (cal) 


执行 以 上 代码 ， 输 出 结果 为 : 
以 下 输出 2017 年 3 月 份 的 日 历 : 
March 2017 
Mo Tu We Th Fr Sa Su 
二 
6 4 0 9 0 1 12 
二 下 5 二 7 下 机 
20' 2 22 .23 24 25 26 
a ei 


es 


calendar 模块 包含 的 常用 内 建 函 数 如 表 4-3 所 示 。 
表 4-3 ” calendar 模块 的 常用 内 建 函 数 


号 函数 及 描述 





calendar.calendar(year.w=2.]=1.c=6) 

返回 一 个 多 行 字符 串 格式 的 year 年 年 历 ，3 个 月 一 行 ， 间 隔 距离 为 c。 每 日 宽度 间隔 为 w 
字符 。 每 行 长 度 为 21xw +18+2xc。1 是 每 星期 行 数 

calendar.firstweekday( ) 

返回 当前 每 周 起 始 日 期 的 设置 。 默 认 情况 下， 首次 载 入 calendar 模块 时 返回 0， 即 星期 一 
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函数 及 描述 
calendar.isleap(year) 
是 头 年 返回 True， 否 则 返回 False 

















calendar.leapdays(y1,y2) 
返回 在 yl1，y2 两 年 之 间 的 闵 年 总 数 





calendar.month(year,month,w=2,]=1) 
返回 一 个 多 行 字符 串 格式 的 year 年 month 月 日 历 ， 两 行 标题 ， 一 周一 行 。 每 日 宽度 间隔 为 w 
字符 。 每 行 的 长 度 为 7*w+6。1 是 每 星期 的 行 数 








calendar.monthcalendar(year,month) 

返回 一 个 整数 的 单 层 嵌 套 列表 。 每 个 子 列表 装载 代表 一 个 星期 的 整数 。year 年 month 月 外 的 
日 期 都 设 为 0; 范围 内 的 日 子 都 由 该 月 第 几 日 表示 ， 从 1 开始 
calendar.monthrange(year,month) 

返回 两 个 整数 。 第 一 个 是 该 月 的 星期 几 的 日 期 码 ， 第 二 个 是 该 月 的 日 期 码 。 日 从 0( 星 期 一 ) 
到 6( 星 期 日 ); 月 从 1 到 12 

calendar.prcal(year,w=2,l=1,c=6) 

相当 于 print calendar.calendar(year,w,l,c) 














calendar.prmonth(year,month,w=2,l=1) 

相当 于 print calendar.calendar(year,w,l,c) 
calendar.setfirstweekday(weekday) 

设置 每 周 的 起 始 日 期 码 。0( 星 期 一 ) 到 6( 星 期 日 ) 
calendar.timegm(tupletime) 





与 time.gmtime 相反 : 接受 一 个 时 间 元 组 形式 ， 返 回 该 时 刻 的 时 间 戳 (从 1970 起 算 经 过 的 浮 
点 秒 数 ) 

calendar.weekday(year,month,day) 
返回 给 定 日 期 的 日 期 码 。0( 星 期 一 ) 到 6( 星 期 日 )。 月 份 为 1( 一 月 ) 到 12( 十 二 月 

















3. 获取 随机 数 (random) 模 块 
Python 中 的 random 模块 用 于 生成 随机 数 。 下 面 介 绍 一 下 random 模块 中 最 常用 的 几 个 














(1) random.random 。 

random.random() 用 于 生成 一 个 0 到 1 之 间 的 随机 浮 点 数 x: 0 和 x<<1.0。 

(2) random.uniform 。 

random.uniform(a, b) 用 于 生成 一 个 指定 范围 内 的 随机 浮 点 数 ， 两 个 参数 一 个 是 上 限 ， 
一 个 是 下 限 。 如 果 a>b， 则 生成 的 随机 数 n 的 范围 为 as 入 n 和 b: 如 果 a<b， 则 bn<a。 

(3) random.randint。 

random.randint(a, b)， 用 于 生成 一 个 指定 范围 内 的 整数 。 其 中 参数 a 是 下 限 ，b 是 上 
限 ， 下 限 必须 不 大 于 上 限 。 生 成 的 随机 数 n 的 范围 为 a<n<b。 
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(4) random randrange。 


Tandom randrange([start,] stop[, step])， 从 指定 范围 内 ， 按 指定 基数 递增 的 集合 中 获取 一 
个 随机 数 。 如 random randrange(20, 100, 2)， 结 果 相 当 于 从 [20, 22, 24, 26, … 96, 98] 序 列 中 
获取 一 个 随机 数 。 

(5) random.choice。 

random.choice 从 序列 中 获取 一 个 随机 元 素 。 函 数 原型 为 random.choice(sequence)。 参 
数 sequence 表示 一 个 有 序 类 型 ， 可 以 是 字符 串 、 列 表 、 元 组 等 。 

不 难看 出 ，random.randrange(20, 100, 2) 在 结果 上 与 random.choice(range(20, 100, 2) 是 等 
效 的 ， 都 是 随机 产生 20~100 之 间 的 一 个 偶数 。 

(6) random.shuffle。 

random.shuffle 的 函数 原型 为 random.shuffle(x[, random])， 用 于 将 一 个 序列 中 的 元 素 打 
乱 。 例 如 : 


>>> L = ["Python", "is", "a","powerful,", "simple", "language"] 
>>> random.shuffle(L) 
>>> print (L) 
['Python', 'is', 'language', 'powerful,', 'simple', "a'] 
>>> random.shuffle(L) 
>>> print (L) 
['is', ‘a', 'powerful,', 'simple', '‘'Python', 'language'] 
>>> 
(7) random.sample。 
random.sample 的 函数 原型 为 random.sample(sequence，k)， 从 指定 序列 中 随机 获取 指定 
长 度 的 片断 ， 但 不 会 修改 原 有 序列 。 
需要 说 明 的 是 ， 上 面 的 7 个 函数 都 是 随机 函数 ， 既 然 是 “随机 ”的 ， 就 意味 着 每 次 返 
的 结果 都 可 能 不 一 样 。 在 不 同 的 机 器 上 运行 ， 结 果 更 是 如 此 。 


4.4 巧 用 lambda 表达 式 


Python 使 用 lambda 来 创建 匿名 函数 。 所 谓 匿 名 ， 意 即 不 再 使 用 def 关键 字 以 标准 的 形 
式 定义 一 个 函数 。 

lambda 表达 式 具 有 如 下 特点 : 

@ lambda 只 是 一 个 表达 式 ， 函 数 体 比 def 简单 很 多 。 

@ ”lambda 的 主体 是 一 个 表达 式 ， 而 不 是 一 个 代码 块 ， 因 而 仅仅 能 在 lambda 表达 式 


回 











中 封装 有 限 的 逻辑 。 
@ ”lambda 函数 拥有 自己 的 命名 空间 ， 且 不 能 访问 自 有 参数 列表 之 外 或 全 局 命名 空间 
里 的 参数 。 


@ ”虽然 lambda 函数 看 起 来 只 能 写 一 行 ， 却 不 等 同 于 C 或 C++ 的 内 联 函数 ， 后 者 的 
目的 是 调用 小 函数 时 不 占用 栈 内 存 从 而 提高 运行 效率 。 


语法 : 
lambda 函数 的 语法 只 包含 一 个 语句 ， 格 式 如 下 : 
lambda [argl [,arg2,....-. argn] ] :expression 
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【 例 4-41】lambda 函数 的 使 用 一 一 加 法 与 减法 : 


# 自 定义 函数 

sum = lambda argl, arg2: argl + arg2 
sub = lambda argl, arg2: argl - arg2 
# 调 用 sum 函数 

print (" 相 加 的 值 : "，sum ( 10，22 )) 
print (" 相 减 的 值 : "，sub ( 20, 5 )) 


执行 以 上 代码 ， 输 出 结果 为 : 
相 加 的 值 : 32 
相 减 的 值 : 15 


【 例 4-42】lambda 函数 的 使 用 


Square = lambda x : X**3 

print (square (3)) #27 
power = lambda x, y : xX **y 
print (power (2, 10)) #1024 


执行 以 上 代码 ， 输 出 结果 为 : 
27 


立方 与 乘客 : 





【 例 4-43】lambda 函数 的 使 用 一 一 按 姓 氏 排序 : 


names = ["Kitty Smit","Wart Kay","Jack Backus","Jim Gold"] 
names.sort (key = lambda name:name.split() [-1]) 
print(",".join (names)) 


执行 以 上 代码 ， 输 出 结果 为 : 
Jack Backus,Jim Gold,Wart Kay,Kitty Smit 
>>> 


了 还 注意 : Python 在 调用 lambda 表达 式 时 绕 过 函数 的 栈 分 配 。lambda 表达 式 运作 起 来 就 
像 一 个 函数 ， 当 被 调用 时 ， 创 建 一 个 框架 对 象 。 


4.5 ”Python 工具 箱 


Python 提供 了 很 多 可 供 直 接 使 用 的 文件 包 ， 前 面 介绍 了 time 和 calendar 两 个 模块 ， 下 
面 再 简要 介绍 一 下 os 和 file 两 个 模块 ， 详 细 的 应 用 参见 第 5 章 。 


1. os( 操 作 系 统 ) 模 块 
os 模块 提供 了 非常 丰富 的 方法 用 来 处 理 文件 和 目录 ， 使 用 时 ， 一 定 要 加 上 导入 语句 


Import os。 


os 模块 常用 的 内 建 函 数 如 表 4-4 所 示 。 
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表 4-4 os 模块 的 常用 内 建 函 数 


函数 及 描述 
os.access(path, mode) 


检验 权限 模式 


孙 数 模块 全 





os.chdir(path) 
改变 当前 工作 目录 





os.chflags(path, flags) 

设置 路 径 的 标记 为 数字 标记 
os.chmod(path, mode) 
更 改 权 限 





os.chown(path, uid, gid) 

更 改 文件 所 有 者 

os.chroot(path) 

改变 当前 进程 的 根 目 录 

os.close(fd) 

关闭 文件 描述 符 弓 

os.lchmod(path, mode) 

修改 连接 文件 权限 

os.dup(fd) 

复制 文件 描述 符 他 

os.dup2(fd, fd2) 

将 一 个 文件 描述 符 亿 复制 到 另 一 个 fd2 
os.fchdir(fd) 

通过 文件 描述 符 改变 当前 工作 目录 


os.fchmod(fd, mode) 


改变 一 个 文件 的 访问 权限 ， 该 文件 由 参数 fa 指定， 参数 mode 是 Unix 下 的 文件 访问 权限 
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os.fchown(fd, uid, gid) 
修改 一 个 文件 的 所 有 权 ， 这 个 函数 修改 一 个 文件 的 用 户 DD 和 用 户 组 人 D， 
符 伺 指定 


该 文件 由 文件 描述 
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os.fdatasync(fd) 


强制 将 文件 写 入 磁盘 ， 该 文件 由 文件 描述 符 但 指定， 但 是 不 强制 更 新 文件 的 状态 信息 
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os.fdopen(fd[, mode[, bufsize]]) 
通过 文件 描述 符 世 创建 一 个 文件 对 象 ， 并 返回 这 个 文件 对 象 
os.fpathconflfd name) 





返回 一 个 打开 的 文件 的 系统 配置 信息 。name 为 检索 的 系统 配置 的 值 ， 它 也 许 是 一 个 定义 系统 





值 的 字符 串 ， 这 些 名 字 在 很 多 标准 中 指定 (POSIX.1、Unix 95、Unix 98 和 


其 他 ) 
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续 表 
函数 及 描述 
os.fstat(fd) 
返回 文件 描述 符 和 的 状态 ， 类 似 于 stat0 
os.fstatvfs(fd) 
返回 包含 文件 描述 符 得 的 文件 系统 的 信息 ， 类 似 于 statvfs0 
os.fsync(fd) 
强制 将 文件 描述 符 为 4 的 文件 写 入 硬盘 
os.ftruncate(fd, length) 
裁剪 文件 描述 符 伺 对 应 的 文件 ， 所 以 它 最 大 不 能 超过 文件 大 小 


局 
uj 











2，file( 文 件 ) 模 块 
file 对 象 使 用 open0 函 数 来 创建 ， 可 以 直接 使 用 ， 不 需要 导入 。file 模块 常用 的 内 建 函 









































数 如 表 4-5 所 示 。 
表 4-5 file 模块 的 常用 内 建 函 数 
序号 函数 及 描述 

a file.close(O) 
关闭 文件 。 关 闭 后 文件 不 能 再 进行 读 写 操作 
file.flushO 

2 刷新 文件 内 部 缓冲 ， 直 接 把 内 部 缓冲 区 的 数据 立刻 写 入 文件 ， 而 不 是 被 动 地 等 待 输出 缓冲 区 
写 入 
file.fileno0) 

3 返回 一 个 整 型 的 文件 描述 符 (File Descriptor，FD)， 可 以 用 在 如 os 模块 的 read 方法 等 一 些 底 
层 操 作 上 

部 fileisattyO 
如 果 文件 连接 到 一 个 终端 设备 ， 则 返回 Tue， 否则 返回 False 

总 filenextO 

- 返回 文件 下 一 行 

file.read([size]) 
从 文件 读 取 指定 的 字 节 数 ， 如 果 未 给 定 或 为 负 ， 则 读 取 所 有 字 节 

7 file.readline([size]) 
读 取 整 行 ， 包 括 “m” 字 符 
file.readlines([sizehint]) 

8 读 取 所 有 行 并 返回 列表 ， 若 给 定 sizehint>0， 返 回 总 和 大 约 为 sizehint 字 节 的 行 ， 实 际 读 取 值 
可 能 比 sizehint 较 大 ， 因 为 需要 填充 缓冲 区 

file.seek(offset[, whence]) 
设置 文件 当前 位 置 

人 fletellO 
返回 文件 当前 位 置 
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3. 一 些 有 用 的 方法 或 功能 
在 实际 编写 程序 的 过 程 中 ， 经 常会 用 到 一 些 常 用 的 方法 或 功能 ， 如 表 4-6 所 示 。 
表 4-6 常用 方法 或 功能 




















方法 或 功能 方法 或 功能 的 说 明 

locals0) 返回 当前 变量 作用 域 中 的 变量 集合 

“+” 操 作 符 用 于 字符 串 时 将 连接 两 个 字符 串 ， 用 于 数值 时 将 两 个 数 相 加 
with 关键 字 可 用 于 处 理 打开 文件 的 关闭 工作 ， 也 可 与 as 关键 字 结 合 使 用 
sys.stdout Python 中 所 谓 的 “标准 输出 ”， 可 以 从 标准 块 sys 模块 访问 
pickle 模块 容易 而 高 效 地 将 Python 数据 对 象 保存 到 磁盘 以 及 从 磁盘 恢复 
helpO 人 允许 在 IDLE Shell 中 访问 Python 文档 
find0 在 一 个 字符 串 中 查找 特定 子 串 
setup.py 程序 提供 模块 的 元 数据 ， 用 来 构建 、 安 装 和 上 传 打包 的 发 布 
len0 提供 某 个 数据 对 象 的 长 度 ， 或 者 统计 一 个 集合 的 项 数 ， 如 列表 中 的 项 数 


4.6 ”案例 实 训 : “ 哥 德 巴赫 猜想 ”的 验证 


哥 德 巴赫 猜想 是 公认 的 世界 数学 难题 ， 我 国 著名 数学 家 陈景润 院士 对 此 做 了 毕生 的 研 
究 。 任 何 一 个 大 于 2 的 偶数 都 可 以 分 解 为 两 个 素数 之 和 ， 这 就 是 著名 的 哥 达 巴赫 猜想 ， 简 
称 1+1( 陈 景 润 已 证 明了 1+2)。 本 例 运行 时 ， 要 求 输入 一 个 大 于 2 的 偶数 ， 程 序 运行 后 ， 输 
出 两 个 素数 ， 其 和 正好 等 于 该 偶数 。 

程序 如 下 : 

# 导 入 数学 模块 


import math 
判断 是 否 为 素数 
def is primer (num) : 
flag=1 
if num==1 or num==2: 
flag=1 
else: 
end=int (math.sqrt (num) ) 
# 循 环 次 数 为 该 数 的 平方 根 取 整 
for j in range(2,end+1): 
# 余 数 为 0， 除 尽 ， 不 是 素数 
if numsgs]j==0: 
flag = 0 
return flag 
# 判 断 哥 德 巴赫 猜想 是 否 成 立 
def is gdbh (num): 
flagl =°0 
if num $ 2 == 0 and num > 2: 


# 循 环 次 数 为 偶数 的 一 半 





(a\. 


mm Python 程序 设计 实用 教程 


for j in range (1,num//2+1) : 
坦 判断 由 偶数 拆 分 成 的 两 个 数 是 否 均 为 素数 
bll =is primer(j) 
bl2 =is primer (num-j) 
if bll==1 and b12==1: 
print ("{0}={1}+{2}".format (num, j, num - j)) 


flagl = 1 
break 
return flagl 
# 测 试 函数 
def test()s 


print ("输入 一 个 大 于 2 的 偶数 : ") 
x=int (input ()) 
While x<=2 or x%2==]: 
print ("输入 一 个 大 于 2 的 偶数 : ") 
x=int (input ()) 
if is gdbh (x)==1: 
print ("{0} 能 写成 两 个 素数 的 和 , 符合 哥 德 巴赫 猜想 。" .format (x) ) 


# 执 行 测试 函数 

if name ==" main ": 
test () 

执行 以 上 代码 ， 输 出 结果 为 : 

输入 一 个 大 于 2 的 偶数 : 

385498 


385498=5+385493 
EE 符合 哥 德 巴赫 猜想 。 


4.7 本 章 小 结 


本 章 介 绍 了 与 函数 相关 的 内 容 。 首 先 介绍 了 Python 代码 编写 规范 、 代 码 的 风格 ， 并 举 
例 加 以 说 明 ; 然后 介绍 了 自 定义 函数 和 自 定 义 模 块 两 部 分 ， 包 括 函 数 的 定义 、 递 归 、 变 量 
作用 域 、 和 迭代 器 、 生 成 器 等 ; 随后 介绍 了 模块 导入 语句 的 使 用 、Python 常用 的 内 建 函数 (如 
输入 和 输出 函数 等 ) 的 使 用 ， 尤 其 是 详细 地 介绍 了 格式 化 输出 的 方法 ; 介绍 了 lambda 表达 
式 语 法 格式 及 其 使 用 方法 ， 最 后 介绍 了 os 模块 、file 模块 以 及 其 他 常用 的 方法 或 功能 。 


习 题 


1. 填空 题 

(1) 函数 定义 以 关键 字 ( ) 开 始 ， 该 行 最 后 以 ( ) 结 束 。 

(2) 没有 retum 语句 的 函数 将 返回 ( 关 

(3) 函数 定义 时 声明 的 参数 称 为 ( )， 而 函数 调用 时 提供 的 参数 称 为 ( % 
(4) 使 用 关键 字 ( ) 可 以 在 一 个 函数 中 设置 一 个 全 局 变量 。 

(5) 设 有 全 lambda x,y :{x:y}， 则 f(2,3) 的 值 是 ( % 
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(6) Python 包含 了 数量 众多 的 模块 ， 通 过 ( ) 语 名 可 以 导入 模块 ， 并 使 用 其 定义 
的 功能 。 
(7) 设 Python 中 有 模块 m， 如 果 希 望 同时 导入 m 中 的 所 有 成 员 ， 则 可 以 采用 ( ) 
的 导入 形式 。 
(8) 建立 模块 bigpy， 模 块 内 容 如 下 : 
def BR < 
print ('Python') 
deE A (ys 
print ('hello') 


为 了 调用 模块 中 的 AO 函 数 ， 应 先 使 用 语句 ( 六 


2. 选择 题 
(1) 下 列 选 项 中 不 属于 函数 优点 的 是 (  )。 
A. 减少 代码 重复 B. 使 程序 模块 化 
C. 使 程序 便于 阅读 D. 便于 发 挥 程序 员 的 创造 力 


(2) 以 下 关于 函数 的 说 法 正确 的 是 (  )。 
A. 函数 定义 时 必须 有 形 参 
B. 函数 中 定义 的 变量 只 在 该 函数 体 中 起 作用 
C. 函数 定义 时 必须 带 retum 语句 
D. 实 参与 形 参 的 个 数 可 以 不 相同 、 类 型 可 以 任意 
(3) 以 下 关于 函数 的 说 法 正确 的 是 (  )。 
A. 函 数 的 实际 参数 和 形式 参数 必须 同名 
B. 函数 的 形式 参数 既 可 以 是 变量 也 可 以 是 常量 
C. 函数 的 实际 参数 不 可 以 是 表达 式 
D. 函数 的 实际 参数 可 以 是 其 他 函数 的 调用 
(4) 有 以 下 两 个 程序 。 
程序 1: 
ast1l72,37451 
def f(a): 
a=a+[6] 
f(a) 
print (a) 
程序 2: 


b=[1,2,3,4,5] 

def f(b): 
b+=[6] 

f(b) 

print (b) 


下 列 说 法 正确 的 是 ( 。 )。 
A. 两 个 程序 均 能 正确 运行 ， 但 结果 不 同 
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B. 两 个 程序 的 运行 结果 相同 
C. 程序 1 能 正确 运行 ， 程 序 2 不 能 
D. 程序 1 不 能 正确 运行 ， 程 序 2 能 
(5) 已 知 全 lambda a,b:atb， 则 f([4],[1,2,3,5]) 的 值 是 ( 
A.[1,2,3,5,4] 了 5 C. [4,1,2,3,5] D. {1,2,3,4,5} 
(6) 下 列 语句 的 运行 结果 是 ( )。 
fl=lambda a:a*3 
£f2=lambda a:a**3 
print (f1 (£2(4))) 


A. 106 B. 148 C. 136 D. 192 
(7) 下 列 程序 执行 后 ，w 的 值 是 ( 。 )。 
def f(a,b): 


return ars»*2 
w=f (£ (1,2),5) 
print (w) 


A. 100 B. 150 (a: D.9 
3. 问答 题 
(1) 简单 叙述 Python 函数 参数 的 类 型 。 
(2) 什么 是 lambda 函数 ? 它 有 什么 用 处 ? 
(3) 如 何在 一 个 function 里 面 设置 一 个 全 局 变量 ? 
(4) Python 是 如 何 进行 类 型 转换 的 ? 
(5) Python 是 如 何 进行 内 存 管理 的 ? 
4. 实验 操作 题 
(1) 编程 输出 裴 波 那 契 数列 的 前 若干 项 。 即 根据 用 户 输 入 的 正 整数 ， 输 出 数列 的 各 
如 输入 正 整数 5S， 则 输出 斐 波 那 契 数列 的 前 五 项 : 1，1，2，3，5。 
(2) 用 函数 实现 最 大 公约 数 算 法 和 最 小 公 倍 数 算 法 ， 编 写 测试 程序 测试 这 两 个 算法 。 
(3) 编程 获取 五 天 前 的 年 月 日 。 
(4) 编程 计算 某 几 个 月 的 天 数 。 
(5) 编程 将 字符 串 转换 为 大 写字 母 ， 或 者 将 字符 串 转 为 小 写字 母 。 
(6) 使 用 函数 库 完 成 十 进 制 数 转 二 进 制 、 八 进 制 、 十 六 进 制 数 的 运算 。 


迪 
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本 章 要 点 


(1) 文件 和 文件 对 象 。 

(2) 文本 文件 的 读 写 。 

(3) os 模块 的 文件 操作 方法 。 

(4) shutil 模块 的 文件 操作 方法 。 

(5) CSV、Excel 文件 的 基本 操作 。 

(6) HTML、XML 文档 的 基本 操作 。 

(7) Python 异常 处 理 机 制 。 

学 习 目 标 

(1) 掌握 文件 的 基本 操作 以 及 对 目录 的 操作 方法 。 
(2) 掌握 CSV、Excel 文件 的 读 写 方法 。 
(3) 掌握 HIML、XML 文档 的 操作 方法 。 
(4) 理解 Python 的 异常 处 理 机 制 。 

(5) 掌握 捕捉 异常 的 基本 方法 。 


之 前 介绍 的 input、print 函数 是 与 外 部 交互 的 函数 ， 它 们 是 对 标准 输入 输出 设备 ( 即 键 
盘 和 屏幕 ) 进 行 操作 的 。 除 此 而 外 ，Python 还 可 以 对 文件 进行 操作 ， 实 现 更 多 的 外 部 交互 。 
本 章 5.1 节 介 绍 打开 文件 、 关 闭 文件 、 创 建文 件 等 基本 操作 。 在 对 文件 和 文件 夹 进行 操作 
时 会 用 到 os 模块 和 shutil 模块 ， 本 章 5.2 节 对 此 予以 介绍 。 除 一 般 文件 外 ，Python 还 可 以 
对 CSV、Excel、HIML、XML 等 文件 进行 创建 、 读 写 等 操作 ，5.3~5.6 节 将 做 具体 介绍 。 

在 编程 过 程 中 ， 难 免 会 出 现 异常 情况 ， 例 如 用 一 个 数 除 以 零 就 是 异常 ， 我 们 是 不 希望 
出 现 这 种 异常 错误 的 ， 所 以 在 编程 时 ， 需 要 判断 正常 和 异常 情况 ， 并 对 异常 情况 进行 处 
理 ， 以 免 发 生 错误 ， 影 响 程序 运行 。5.7 节 和 5.8 节 将 对 此 做 详细 介绍 。 


5.1 文件 的 基本 操作 





5.1.1 “打开 文件 


使 用 文件 之 前 ， 须 首先 打开 文件 ， 然 后 进行 读 、 写 、 添 加 等 操作 。Python 打开 文件 使 
用 open 函数 ， 其 语法 格式 为 : 

open (name [,mode [,buffering]]) 

其 中 ， 文 件 名 name 为 必 选 参数 ， 模 式 mode 和 缓冲 buffering 是 可 选 参数 。 该 函数 返 
回 一 个 文件 对 象 。 

【 例 S-1】 打 开 一 个 文本 文件 : 

f = openl(r"C:\Users\test.txt") 

上 述 语句 直接 打开 一 个 指定 的 文件 ， 如 果 文 件 不 存在 则 创建 该 文件 。 这 里 的 f 是 一 个 
文件 对 象 ， 它 与 指定 的 文件 建立 了 关联 ， 很 多 文献 称 【 为 文件 描述 符 ， 实 际 上 它 可 视 为 指 








.{ 128\,. 


第 5 章 文件 与 异常 外 理 仇 国 要 本 


定 文件 的 “句柄 ”， 所 有 对 指定 文件 的 后 续 操作 都 将 通过 这 个 句柄 进行 ， 直 到 使 用 后 面 将 
要 介绍 的 close0O 函 数 关闭 指定 文件 为 止 。 

如 果 open 函数 后 面 的 参数 中 只 带 一 个 文件 名 ， 我 们 只 是 获得 了 能 读 取 文 件 内 容 的 文 
件 对 象 ( 即 上 面 的 f。 若 要 在 文件 中 写 入 内 容 ， 就 必须 要 提供 一 个 模式 参数 来 显 式 地 声明 。 
open 函数 中 的 模式 参数 如 表 5-1 所 示 。 


表 5-1 open 函数 中 的 模式 参数 
描 述 





读 模式 

写 模式 

追加 模式 

二 进 制 模式 (可 添加 到 其 他 模式 中 使 用 ) 
读 / 写 模式 (可 添加 到 其 他 模式 中 使 用 ) 


其 中 读 模式 是 默认 模式 。 写 模式 即 向 文件 中 写 入 内 容 。+’ 参 数 可 以 用 到 其 他 任何 模式 
中 ， 指 明 读 和 写 都 是 允许 的 。?b "模式 用 于 改变 处 理 文件 的 方法 。 一 般 来 说 ，Python 处 理 文 
本 文件 (包括 字符 ) 时 没有 问题 ， 但 如 果 处 理 的 是 一 些 其 他 类 型 的 文件 (二 进 制 文件 )， 如 声音 
剪辑 或 图 像 等 ， 则 应 在 模式 参数 中 增加 “b*"， 明 确 指出 按 二 进 制 形式 来 处 理 文件 。 

模式 参数 组 合 及 描述 如 表 5-2 所 示 。 


表 5-2 模式 参数 组 合 及 其 描述 

















模式 参数 组 合 描 述 
La 3 
w+ 参见 w) 
at 以 读 写 模 式 打 开 ( 参 见 a) 
也 b 以 二 进 制 读 模式 打开 
wb 以 二 进 制 写 模式 打开 (参见 w) 
ab 以 二 进 制 追加 模式 打开 (参见 a 
Tb+ 以 二 进 制 读 写 模式 打开 (参见 rH) 
wb+ 以 二 进 制 读 写 模式 打开 (参见 w+) 
ab+ 以 二 进 制 读 写 模式 打开 (参见 ab) 





这 里 需要 强调 一 下 使 用 二 进 制 模式 的 理由 。 使 用 二 进 制 模式 读 写 文件 时 ， 与 使 用 文本 
模式 不 会 有 很 大 区 别 。 但 是 ， 在 使 用 二 进 制 模式 时 ，Python 会 原样 给 出 文件 中 的 内 容 ， 在 
文本 模式 下 则 不 一 定 。Python 对 于 文本 文件 的 操作 方式 中 唯一 要 用 到 的 技巧 是 标准 化 换行 
符 。 一 般 来 说 ， 换 行 符 (mm 表示 结束 一 行 并 另 起 一 行 ， 这 也 是 Unix 系统 中 的 规范 ， 但 在 
Windows 中 一 行 结束 的 标志 是 Wn。 为 使 程序 能 跨 平台 运行 ，Python 在 这 里 做 了 一 些 自动 
转换 : 当 在 Windows 下 用 文本 模式 读 文件 中 的 文本 时 ，Python 将 \rn 转换 成 m;， 相反 地 ， 
在 Windows 下 用 文本 模式 向 文件 中 写 文本 时 ，Python 将 由 转换 成 mm。 
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在 使 用 二 进 制 文件 时 可 能 会 出 现 问题 ， 因 为 文件 中 可 能 包含 被 解释 成 换行 符 的 字 节 ， 
而 使 用 文本 模式 时 会 自动 转换 。 这 样 会 破坏 二 进 制 数据 ， 所 以 使 用 二 进 制 模式 时 ， 不 会 发 
生 转 换 。 

壮 注意 : 通过 在 模式 参数 中 使 用 U 参数 ， 能 在 打开 文件 时 使 用 通用 的 换行 符 支 持 模 
式 ， 在 这 种 模式 下 ， 所 有 的 换行 符 (rm、 或 由 ) 都 被 转换 成 nm， 而 不 考虑 所 运 
行 的 平台 。 
open 函数 的 第 三 个 参数 控制 文件 的 缓冲 ， 对 参数 值 的 说 明 如 表 5-3 所 示 。 
表 5-3 open 函数 的 缓冲 参数 












































描 述 
IO 无 缓冲 ， 即 所 有 读 写 操作 直接 针对 硬盘 





IO 有 缓冲 ， 即 使 用 内 存 代 蔡 硬盘 





大 于 1 的 数字 表示 缓冲 区 的 大 小 (以 字 节 为 单位 ) 
-1( 或 任何 负数 ) 表示 使 用 默认 的 缓冲 区 大 小 








5.1.2 关闭 文件 


文件 使 用 完毕 后 应 及 时 关闭 。 在 Python 中 关闭 文件 用 close 方法 。 通 常 来 说 ，Python 
会 在 一 个 文件 不 用 后 自动 将 其 关闭 ， 不 过 这 一 功能 没有 保证 ， 因 为 Python 可 能 会 缓存 写 入 
的 数据 ， 如 果 程 序 因 为 某 种 原因 崩溃 ， 数 据 就 有 可 能 没有 完整 地 写 入 到 文件 中 ， 从 而 引发 
文件 故障 。 因 此 ， 最 好 还 是 养 成 自己 关闭 文件 的 习惯 。 如 果 一 个 文件 在 关闭 后 还 对 其 进行 
操作 ， 则 会 产生 ValueError 错误 。 

【 例 5-2】 关 闭 文本 文件 。 

要 关闭 例 5-1 中 的 f 文 件 对 象 ， 可 以 使 用 如 下 语句 : 


f.close() 


该 语句 执行 后 ，f 与 test.txt 的 关联 不 复 存在 ， 当 然 也 就 不 能 再 对 test.txt 文件 进行 读 写 
了 ， 除 非 再 度 打开 。 


5.1.3 ”在 文本 文件 中 读 取 数据 


在 文本 文件 中 读 取 数 据 的 语法 格式 为 : 
f.read([size]) #size 为 读 取 的 长 度 ， 以 byte 为 单位 
f.readline([size]) # 读 一 行 ， 如 果 定 义 了 size， 有 可 能 返回 的 只 是 一 行 的 一 部 分 
f.readlines([size]) # 把 文件 每 一 行 作为 1ist 的 一 个 成 员 ， 并 返回 这 个 1ist 
其 实 ，readlines() 的 内 部 是 通过 循环 调用 readline() 来 实现 的 。 如 果 提 供 size 参数 (size 
是 表示 读 取 内 容 的 总 长 )， 则 可 能 只 读 到 文件 的 一 部 分 。 
【 例 5-3】 读 取 文 本 文件 内 容 : 
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>>> f = open(r“C:\Users\test. txt”) 
>>>f.read(5) 

"Hello 

>>>》f. close() 

>>> f = open(r"C:\UsersNtest. txt”) 
>>>》f.readline () 

"Hello World!” 

>>> f.close() 


这 里 假设 在 C:\Users 目录 下 有 一 个 文本 文件 testtxt， 文 本 内 容 为 “Hello World!”。 
可 以 看 出 ，readline() 将 文件 对 象 人 也 就 是 文本 文件 testtxb 的 一 行内 容 读 出 来 了 。 


5.1.4 创建 文本 文件 


在 Python 中 ， 以 追加 模式 打开 文本 文件 即 可 创建 此 文件 ， 语 法 格式 为 : 
open (name, 'a' [,buffering]) # 创 建 空 文件 


【 例 5-4】 创 建文 本 文件 。 
在 C 盘 的 Users 目录 下 创建 一 个 文本 文件 text txt， 可 使 用 语句 : 


上 = openl(r'C:\Users\text.txt', "a') 


语句 执行 后 ， 将 在 相应 的 目录 下 生成 一 个 名 为 text.txt 的 文件 。 因 尚未 向 其 中 添加 数 
据 ， 其 字 节 数 为 0。 


5.1.5 ”向 文本 文件 中 添加 数据 


向 文件 中 写 入 数据 的 函数 是 write0 和 writelines0， 其 语法 格式 为 : 


f.write (str) # 把 str 写 到 文件 中 ，write () 并 不 会 在 str 后 加 上 一 个 换行 符 
f.writelines (seq) # 把 seq 的 内 容 全 部 写 到 文件 中 (多 行 一 次 性 写 入 ) 。 
# 这 个 函数 也 只 是 忠实 地 写 入 ， 不 会 在 每 行 后 面 加 上 任何 东西 


【 例 5-$】 向 文本 文件 中 添加 数据 。 
假设 我 们 向 D:\xunlian\test.txt 文件 中 写 入 数据 ， 可 以 使 用 下 列 语句 : 


>>> f = open(r”D:\xunlian\test. txt”, 'w ) 
>>> str = Welcome to China! 

>>>f. write(str) 

1 


7 

>>>f. close() 

>>> f = open(T“D:\xunlianNtest. txt”,’r’) 
>>> f.read() 

”Welcome to China!” 

>>>f. close() 


其 中 的 17 表示 向 文本 文件 testtxt 中 写 入 了 17 个 字符 。 
5.1.6 文件 指针 


假设 我 们 读 取 文本 文件 test.txt， 文 本 内 容 为 “Welcome to China!”， 当 用 两 个 read 方 
法 读 取 时 ， 第 一 个 read 返回 “Welcome to China'， 第 二 个 read 返回 “， 即 不 能 重复 读 取 ， 
这 是 为 什么 呢 ? 
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这 种 现象 与 文件 指针 有 关 。 对 文件 操作 时 ， 文 件 内 部 会 有 一 个 文件 指针 来 定位 当前 位 


置 ， 控 制 文件 指针 位 置 可 以 实现 重复 读 取 ， 用 seek 方法 可 以 控制 文件 指针 的 位 置 ， 其 语法 
格式 为 : 


seek (offset[, whence]) 埋 移 动 文件 指针 

各 参数 的 含义 如 下 : 

offset: 偏 移 量 。 一 般 是 相对 于 文件 的 开头 来 计算 的 ， 且 一 般 为 正 数 。 

whence: 偏 移 相 对 位 置 。whence 可 以 为 0， 表示 从 头 开始 计算 ， 为 1 则 表示 以 当前 位 


置 为 原点 计算 ， 为 2 则 表示 以 文件 末尾 为 原点 进行 计算 。 
狂 注意 : 如 果 文件 以 a 或 a+ 的 模式 打开 ， 每 次 进行 写 操作 时 ， 文 件 操作 标记 都 会 自动 


返回 到 文件 末尾 。 


偏 移 相 对 位 置 常量 有 SEEK_SET、SEEK_CUR、SEEK_END。 

0s.SEEK_SET: 表示 文件 的 起 始 位 置 ， 即 0( 默 认 情况 )， 此 时 offset 必须 为 0 或 正 数 。 
0s.SEEK_CUR: 表示 文件 的 当前 位 置 ， 即 1， 此 时 offset 可 以 为 负数 。 
os.SEEK_END: 表示 文件 的 结束 位 置 ， 即 2， 此 时 offset 通常 为 负数 。 

欲 获取 文件 指针 位 置 ， 可 以 使 用 tell 方法 ， 其 语法 格式 为 : 

f.tell() # 返 回 文件 操作 标记 的 当前 位 置 ， 以 文件 的 开头 为 原点 


【 例 5-6】 获 取 文件 指针 的 当前 位 置 。 
上 一 例 中 ，test.txt 文件 中 的 文本 内 容 为 “Welcome to China!”， 若 第 二 次 读 取 ， 则 会 


输出 ”， 可 以 使 用 seek 函数 使 其 从 头 开始 读 取 : 


>>> f = open(T“D:NxunlianNtest. txt”,’r’) 
>>> f.readline () 

”Welcome to China 

>>> f. seek (0) 


>>> f. readline() 
”Welcome to China!’ 
>>> f£. tell() 


17 
>>> f. close() 
可 见 ， 从 文件 中 读 出 “Welcome to China!” 后 ， 文 件 指针 的 当前 位 置 为 17。 


5.1.7 ”截断 文件 


截断 文件 使 用 truncate 方法 ， 把 文件 截 成 规定 的 大 小 ， 默 认 的 是 截 到 当前 文件 操作 标 


记 的 位 置 。 截 断 文件 的 语法 格式 为 : 


f.truncate([size]) 


如 果 size 比 文件 的 大 小 还 要 大 ， 依 据 系 统 的 不 同 ， 可 能 是 不 改变 文件 ， 也 可 能 是 用 0 


把 文件 补 到 相应 的 大 小 ， 也 可 能 是 把 一 些 随机 的 内 容 加 上 去 。 
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【 例 5-7】 截断 文件 。 
在 test.txt 文件 中 又 写 入 一 行 “Thank you very much!”， 看 截断 后 能 否 再 输出 : 
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>>> f = open(r”’D:\xunlian\test. txt”,’ r+ ) 
>>> f. truncate (18) 


18 

>>> f£.readline() 

”Welcome to China! ’ 

>>> f. readline() 

>>> f.close() 

可 以 看 出 ， 截 断后 读 出 的 内 容 为 空 串 ， 即 第 18 个 字符 以 后 的 内 容 读 不 出 来 ， 亦 即 截 
断后 不 能 再 输出 。 


5.1.8” 复制、 删除、 移动 、 重 命名 文件 


复制 文件 使 用 shutil 模块 中 的 方法 ， 涉 及 到 的 方法 (函数 ) 有 copy、copyfile、copytree。 
分 别 对 各 个 方法 进行 说 明 : 
shutil.copy (src, dst) # 复 制 数据 从 src 到 dst (src 为 文件 ，dst 可 以 为 目录 ) 


shutil.copyfile(src，dst)  # 复 制 数据 从 src 到 dst (src 和 dst 均 为 文件 ) 
shutil.copytree (src，dst) ， # 递 归 复制 文件 夹 ， 其 中 src 和 dst 均 为 目录 ， 且 dst 不 存在 


删除 文件 使 用 os 模块 中 的 remove 方法 : 

os .remove (path) #path 为 文件 的 路 径 名 

移动 文件 使 用 shutil 模块 中 的 move 方法 : 

shutil.move (src，dst) # 移 动 数据 从 src 到 dst，src 和 dst 可 以 为 文件 ， 也 可 以 为 目录 


重 命 名 文件 或 目录 使 用 os 模块 中 的 rename 方法 : 
os.rename (old, new) #old 为 原文 件 名 ，new 为 更 改 后 的 文件 名 


【 例 5-8】 使 用 copy 方法 复制 文件 : 

>>> import shutil 

>>> import os 

>>> os. chdir (r' D: ) 

>>> shutil. copy(T D:\xunlian\testl. txt ，D:\practice ) 
'D:\\practice\\testl. txt’ 

>>> shutil. copy(r’ D:\practice\testl. txt ,r’D:\practice\test2. txt’ ) 
’'D:\\practice\\test2. txt’ 


第 一 个 shutil.copy0 将 D:xunlian 下 的 testl.txt 文件 复制 到 D:\practice 文件 夹 下 ; 第 二 
个 shutil.copy0 将 D:\practice 下 的 testl.txt 文件 复制 到 此 文件 夹 下 ， 命 名 为 test2.txt。 

在 copy 方法 中 ， 如 果 dst 是 文件 夹 ， 则 把 src 文件 复制 到 该 文件 夹 中 ， 如 果 dst 是 文 
件 ， 则 把 src 文件 复制 到 dst 文件 中 ， 即 复制 + 重 命名 。 本 例 及 后 面部 分 例题 中 用 到 的 
os.chdir() 是 os 模块 中 切换 到 指定 目录 所 用 的 方法 。 

【 例 5-9】 使 用 copyfile 方法 复制 文件 。 

使 用 copyfile 方法 的 前 提 是 目标 文件 具有 写 权 限 ， 否 则 将 会 产生 IoError 错误 。 我 们 使 
用 glob(pathname) 函 数 返回 所 有 匹配 的 文件 路 径 列 表 ， 这 里 既 可 以 是 绝对 路 径 ， 也 可 以 是 
相对 路 径 。 





下 
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>>> 


import shutil 

ort glob 

>>> import os 

>>> os. chdir (r D:\practice’ ) 

>>> print( before:， ,glob. glob( list.* )) 
before: [ list.txt ] 

>>> shutil. copyfile( list. txt" ，1ist. txt. copy ) 
Siat tt copy 

>>> print( after:’, glob. glob( list. *’ )) 

after: [ list.txt’, 'list. txt.copy ] 






可 以 看 到 ，shutil.copyfile0 将 Di\practice 文件 夹 下 的 list.txt 复制 并 命名 为 list.txt.copy。 


【 例 5$-10】 使 用 copytree 方法 复制 文件 : 


>>> import os 
>>> import shutil 


>>> import tempfile 
>>> dirl = tempfile. mktemp( -dir ) # 返 回 一 个 临时 文件 的 路 径 ， 但 不 创建 该 临时 文 


>>> os. mkdir (dirl) ， 

>>> dir2 = dirl + '. copy’ 

>>> print (dirl, dir2) 

C:\Users\BBQ\AppData\Local\Temp\tmppgkpk ji16. dir C:\Users\BBQ\AppData\Local\ 
Temp\tmppgkpkj16. dir. copy 

>>> shutil. copytree (dirl, dir2) 
'C:\\Users\\BBQ\\AppData\\Local\\Temp\\tmppgkpkj16. dir. copy’ 


shutil.copytree() 将 创建 的 临时 文件 dirl 复制 到 dir2， 即 dirl.copy。 
【 例 5-11) 文件 删除 。 

使 用 remove() 方 法 删除 D:\practice 目录 下 的 text.txt 文件 : 

import os 

os.chdir(r'D:\practice') 

os.remove('text.txt') 

执行 上 述 命令 后 ，D:\practice 目录 下 的 text. txt 文件 不 复 存 在 。 
【 例 5-12】 文件 移动 。 


使 用 move 方法 将 文件 或 文件 夹 移动 到 另 一 目录 ， 使 用 glob 函数 获得 文件 路 径 : 


>>> import shutil 

>>> import glob 

>>> import os 

>>> os. chdir (r D:\practice’ ) 

>>> print( before: ,glob. glob( new. * )) 
before: [new. txt’] 

>>》 shutil.move( new. txt’, new. out ) 
new. out 

>>>》print( after: ,glob. glob( new. * )) 
after: [ new.out’] 


shutil.move() 将 D:\practice 目录 下 的 new.txt 移动 到 当前 目录 下 ， 命 名 为 new.out。 


【 例 5-13】 文件 重 命名 
把 当前 目录 下 的 文件 text. txt 重 命 名 为 textl. txt， 使 用 的 语句 为 : 


os.rename('text.txt','text] .txt') 


5.2 指定 目录 下 的 文件 操作 


5.2.1 获取 当前 目录 
获取 Python 当前 脚本 运行 目录 的 方法 为 getcwd0， 其 语法 格式 为 : 
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os. getcwd() 


【 例 5-14】 得 到 当前 工作 空间 的 目录 : 
>>> import os 

>>> f = os. getcwd() 

> 

’"D:\\practice’ 


5.2.2 ”获取 当前 目录 下 的 内 容 
os 模块 下 的 listdir 方法 用 于 获取 当前 目录 下 所 有 的 文件 和 目录 名 ， 其 语法 格式 为 : 


os.1istdir() 


【 例 5-15】 获 取 指定 文件 夹 下 面 的 所 有 文件 及 文件 来 ， 如 果 指 定 的 文件 夹 不 存在 ， 则 
相应 的 提示 信息 : 


import os 
def listdir(dir path) : 
if os.path.exists(dir path) : 
return os.listdir (dir path) 
else: 
return ' 目 录 '+ dir path + ' 不 存在 ' 


返 


回 





if name ==" main ": 
f=listdir(r"d:\practice") # 该 目录 存在 
print (f) 
f=listdir(r"d:\practices") ”# 该 目录 不 存在 
print (f) 


中 list. txt’ ， "list. txt. copy’, 'new.out’, ’testl. txt’, ’ test2. txt’, 
enki ttl 

目录 D: \practices 不 存在 

>>> 


5.2.3 创建、 删除 目录 
创建 单个 目录 的 语法 格式 为 : 


os.mkdir ("file") 


删除 目录 有 两 种 方法 ， 分 别 调用 os 模块 的 rmdir 方法 和 shutil 的 rmtree 方法 ， 不 同 的 
是 前 者 只 能 删除 空 目 录 ， 而 后 者 空 目录 和 非 空 目录 均 可 删除 。 








os.rmdir ("dir") ## 只 能 删除 空 目录 

shutil.rmtree ("dir") # 空 目录 、 有 内 容 的 目录 都 可 以 删 
【 例 $-16】 创 建新 目录 : 

import os 


os.mkdir(r'D:\newdir') 


.(135\. 


mm Python 程序 设计 实用 教程 


【 例 5-17】 删 除 空 目录 ， 首 先 判 断 是 否 是 空 目 录 : 


import os 
def delete dir(dir): 
if os.path. isdir(dir): 
for item in os.1listdir(dir): 
if item!="System Volume Information' : 
delete dir(os.path. join(dir, item)) 
if not os.1istdir(dir): 
os. rmdir(dir) 


£f = delete dir(r'D:\newdir') 


运行 上 面 的 代码 ， 将 删除 D 盘 下 的 newdir 目录 (前 提 是 目录 为 空 )。 
【 例 5-18】 使 用 mmtree 方法 删除 目录 : 

import shutil 

dir path = r'D:\test' 

shutil.rmtree (dir path) 


5.3 CSV 文 件 


CSV 是 逗号 分 隔 值 Comma-Separated Values 的 缩写 ， 其 文件 以 纯 文本 形式 存储 表格 数 
据 ( 数 字 和 文本 )。CSV 并 不 是 一 种 单一 的 、 定 义 明 确 的 格式 (尽管 RFC 4180 有 一 个 被 通常 
使 用 的 定义 )。 因 此 在 实践 中 ， 术 语 CSV 泛 指 具有 以 下 特征 的 任何 文件 。 

(1) 纯 文本 ， 使 用 某 个 字符 集 ， 比 如 ASCII、Unicode、EBCDIC 或 GB2312。 

(2) 由 记录 组 成 (典型 的 是 每 行 一 条 记录 )。 

(3) 每 条 记录 被 分 隔 符 分 隔 为 字段 (典型 分 隔 符 有 逗号 、 分 号 或 制 表 符 ;， 有 时 分 隔 符 可 
以 包括 可 选 的 空格 )。 

(4) 每 条 记录 都 有 同样 的 字段 序列 。 

通常 可 以 使 用 Wordpad、Notepad( 记 事 本 ) 或 Excel 来 打开 CSV 文件 。 

一 般 情况 下 ， 我 们 用 Excel 生成 的 文件 的 扩展 名 是 xls 或 xlsx， 如 果 直 接 重 命名 为 
CSV 扩展 名 (下 称 CSV 格式 )， 会 报错 。 其 解决 方法 是 ， 将 Excel 生成 的 表 直 接 存 为 CSV 
格式 ， 或 将 原 有 文件 另存 为 CSV 格式 。 

Python 本 身 就 带 有 CSV 包 ， 使 用 时 ， 先 用 import csv 导入 即 可 ， 使 用 CSV 包 可 以 对 
CSV 文件 进行 读 写 操作 。 


5.3.1 读 CSV 文 件 


在 Python 的 csv 模块 中 ， 有 读 CSV 文件 的 方法 reader()， 下 面 举例 说 明 如 何 使 用 
reader 函数 读 取 CSV 文件 。 

【 例 5-19】CSV 文件 的 读 取 。 

有 如 下 CSV 文件 : 
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80082 4432 4355 2345 

9888.43 4325.6 89331 435 

43772.9 477 9334 325 
读 取 CSV 数据 的 代码 及 运行 结果 为 : 
>>> import cSV - 
>>> 人 = csv. reader (open(T D:\xunlian\one. csv , encoding="u 
tf-8 
>>> for row in csv_reader: 

print (row) 


[’ 80082\t4432\t4355\t2345’ ] 
[’ 9888. 43\t4325. 6\t89331\t435’ ] 
[* 43772. 9\t477\t9334\t325’ ] 


5.3.2 写 CSV 文 件 


在 Python 中 ， 写 CSV 文件 使 用 csv 模块 中 的 writer 方法 和 writerow 方法 。writer 方法 
用 于 将 数据 转化 为 带 分 隔 符 的 字符 串 ( 给 定 文件 对 象 的 模式 必须 为 "w7)，writerow 方法 用 于 
将 一 行 数据 写 入 文件 中 。 

【 例 5-20】 在 上 述 CSV 文件 中 写 入 数据 “1，2，3，4”: 

import csV 

TSEE de 

out = open(r'D:\xunlian\one.csv','w') 

CSV writer = csv.writer (out) 


CSV writer.writerow (list) 
out .close() 


直接 使 用 这 种 写法 可 能 会 导致 文件 每 一 行 后 面 多 一 个 空 行 。 解 决 方案 如 下 : 


out = open(r'D:\xunlian\one.csv', 'w',newline="'') 
CSV writer = csv.writer(out, dialect='excel') 
CSV writer.writerow (list) 

out .close() 


将 上 述 代 码 放 入 一 个 程序 中 ， 运 行 后 ， 可 以 得 到 如 图 5-1 所 示 的 one.csv 文件 。 


i 


文件 ”开始 插入 页 面 布局 公式 数据 审阅 视图 Team 
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图 5-1 例 5-20 的 运行 结果 
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5.4 “Excel 文件 


在 学 习 和 工作 的 过 程 中 ， 我 们 经 常用 到 Excel 文件 ，Python 也 可 以 处 理 Excel 文件 。 





操作 Excel 文件 主要 用 到 xlrd 和 xlwt 两 个 库 ，xlrd 是 读 Excel 文件 的 模块 ，xlwt 是 写 Excel 
文件 的 模块 。 在 对 Excel 文件 进行 读 写 操作 时 ， 需 要 先 下 载 并 安装 xlrd 库 和 xlwt 库 。 


5.4.1 使 用 xlrd 读 Excel 文件 


xlrd 提供 的 接口 较 多 ， 常 用 的 是 : 
open_workbook () # 打 开 指定 的 Excel 文件 ， 返 回 一 个 Book 对 象 
通过 Book 对 象 ， 可 以 得 到 各 个 Sheet 对 象 (一 个 Excel 文件 可 以 有 多 个 Sheet， 每 个 


Sheet 就 是 一 张 表 格 )。 例 如 : 


Book.nsheets # 返 回 Sheet 的 数目 
Book.sheets () # 返 回 所 有 Sheet 对 象 的 1ist 


Book.sheet by index (index) 


# 返 回 指定 索引 处 的 Sheet。 相 当 于 Book.sheets () [index] 


Book.sheet names () # 返 回 所 有 Sheet 对 象 名 字 的 1ist 
Book. sheet by name (name) # 根 据 指定 Sheet 对 象 名 字 返 回 Sheet 


通过 Sheet 对 象 可 以 获取 各 个 单元 格 ， 每 个 单元 格 是 一 个 Cell 对 象 : 





Sheet .name # 返 回 表 格 的 名 称 
Sheet .nrows # 返 回 表格 的 行 数 
Sheet .ncols # 返 回 表格 的 列 数 
Sheet .row (r) # 获 取 指 定 行 ， 返 回 cell 对 象 的 1ist 
Sheet .row values (r) # 获 取 指 定 行 的 值 ， 返 回 1ist 
Sheet .col (c) # 获 取 指定 列 ， 返 回 cell 对 象 的 1ist 
Sheet .col values (c) # 获 取 指定 列 的 值 ， 返 回 1ist 
Sheet .cell(r，c) # 根 据 位置 获 取 Cell 对 象 
Sheet .cell value(r, c) # 根 据 位 置 获取 cell 对 象 的 值 
Cell.value # 返 回 单元 格 的 值 
【 例 5-21】 使 用 xrld 读 Excel 文件 。 

test.xls 文档 的 内 容 如 下 : 

1 2 3 4 二 6 

a b - d 6 

ya 8 9 0 1 2 

g h i j k I 
使 用 xlrd 读 取 此 文档 的 代码 为 : 
import xlrd 


wb = xlrd. open workbook (r'D:\xunlian\test.xls') 
志 打 印 每 张 表 的 最 后 一 列 
# 方 法 1 
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for s in wb.sheets() : 


Print("The last column of sheet %s:" $(s.name)) 
for i in range(s.nrows) : 
print (s.row(i)[-1] .value) 
# 方 法 2 
for i in range (wb.nsheets) : 
s = wb.sheet by index(i) 
print ("The last column of sheet %s:" $(s.name)) 
for v in s.col values(s.ncols - 1) 
print (v) 
# 方 法 3 
for name in wb.sheet names( ): 
print ("The last column of sheet %s:" $ (name)) 
5 = wb.sheet by name (name) 
© = 3 Nc0ls =1 
for r in range(s.nrows) 
print(s.cell value(r, c)) 


将 上 述 代码 放 入 一 个 程序 中 ， 运 行 结果 为 : 
we last column of sheet Sheetl: 


The last column of sheet Sheetl: 


The last column of sheet Sheetl: 





5.4.2 ”使 用 xlwt 写 Excel 文件 


xlwt 提供 的 接口 相对 xlrd 来 说 要 少 ， 主 要 有 : 


Workbook () # 构 造 函数 ， 返 回 一 个 工作 短 的 对 象 
Workbook.add sheet (name) # 添 加 了 一 个 名 为 name 的 表 ， 类 型 为 Worksheet 


Workbook.get sheet (index) 
# 可 以 根据 索引 返回 Worksheet (前 提 是 已 经 添加 到 Workbook 中 了 ) 


Worksheet .write(r, c, value) # 将 value 填充 到 指定 位 置 


Worksheet .row (n) # 返 回 指定 的 行 
Row.write(c, value) # 在 某 一 行 的 指定 列 写 入 value 
Worksheet .col (n) # 返 回 指定 的 列 


# 通 过 对 Row .height 或 column .width 赋值 ， 可 以 改变 行 或 列 默认 的 高 度 或 宽度 
# (单位 : 0.05 pt， 即 1/20 pt) 
Workbook.save (filename) 间 保 存 文件 


逮 注意 : 
@ xlwt 模块 至 多 能 写 65535 行 、256 列 ， 如 果 超 过 这 个 范围 ， 程 序 运行 就 会 出 现 错 
误 ， 这 时 ， 需 要 通过 其 他 一 些 途径 来 解决 。 如 果 我 们 只 注重 数据 的 处 理 ， 那 么 可 
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File 


.HAD 


以 采用 csv 模块 来 替代 。 


@@ “文件 默认 的 编码 方式 是 ASCII， 要 改变 编码 方式 ， 指 定 Workbook() 的 encoding 参 


数 即 可 ， 如 Workbook(encoding“utf-8”)。 


@。 表 的 单元 格 默 认 是 不 可 重复 写 的 ， 如 果 有 需要 ， 在 调用 add _sheet() 的 时 候 指定 参 


数 cell overwrite ok=True 即 可 。 
【 例 5-22】 向 新 的 Excel 文件 中 写 入 数据 并 保存 文件 : 


import xlwt 
book = xlwt.Workbook (encoding="'utf-8') 


sheet = book.add sheet('sheet test', cell overwrite ok=True) 


sheet.write (0, 0, 'mike') 
sheet.row(0) .write(1l, '&') 

sheet .write (0, 2, 'jack') 
sheet.col(2) .width = 300 
book.save(r'D:\xunlian\testl.xls') 


将 上 述 代码 放 入 一 个 程序 中 ， 运 行 后 ， 可 以 得 到 如 图 5-2 所 示 的 testl.xls 文件 。 


= test1xls [ 茹 大 模式 .登录 T 


(数据 市 阅 视图 Team 9 








A1 A mi v 
A B Gd D E F G H ~ 

和 [mkxe ls jack 

2 

3 

四 

sheet test | 可 1 ， 
就 渚 围 - + + 100% 


5-2” 例 5-22 的 运行 结果 


除了 写 入 数据 ，xlwt 还 可 以 改变 单元 格格 式 。write 方法 允许 接受 一 个 XFStyle(Excel 


Style) 类 型 的 参数 ， 置 于 最 后 。 
使 用 easyxfO 可 快速 生成 一 个 XFStyle 对 象 。 
【 例 5-23】 使 用 xlwt 改变 单元 格格 式 : 


import datetime, xlwt 

f = xlwt.Font() 

-name = "Arial' 

.height = 240 

= xlwt.Pattern() 

.pattern = xlwt.Pattern.SOLID PATTERN 
.pattern fore colour = 0x0A 

= xlwt.XFStyle() 

-num format str = '0.00%" 

:EonE = 所 

.pattern = p 

S1 = xXlwt.XFStyle() 

sl.num format str = 'YYYY-MM-DD' 
slsFont 二 

Sipatteorn = 

a = 8 

ED 


uuudrmnhnm 
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wb = xlwt.Workbook() 

= wb.add sheet('outl') 
# 以 百分比 的 形式 显示 ， 保留 两 位 小 数 
ws.write(0,3,float (a/b),s) 
# 显 示 日 期 
Ws.row(0) .write (4,datetime.date (2017, 6,1),s1) 
wbh.save(r'D:\xunlian\out.xls') 


将 上 述 代 码 放 入 一 个 程序 中 ， 运 行 后 ， 可 以 得 到 如 图 5-3 所 示 的 out.xls 文件 。 


数据 车 阅 视 团 Team 





证 时 四 口 - + + 100% 


5-3” 例 5-23 的 运行 结果 
5.4.3 ”使 用 xlutils 修改 Excel 文件 


通过 xlrd.open_ workbookO 打 开 的 Book 对 象 是 只 读 的 ， 不 能 直接 对 其 进行 修改 操作 ， 
而 xlwt.Workbook() 返 回 的 Workbook 对 象 虽然 可 写 ， 但 是 写 的 时 候 只 能 从 零 写 起 ， 若 需要 
修改 一 个 已 存在 数据 的 Excel 文件 ， 将 如 何 操作 呢 ? 接 下 来 进行 介绍 。 

使 用 xlutils.copy 中 的 copy0 方 法 ， 可 以 将 一 个 xlrd.Book 对 象 转化 为 一 个 
xlwt.Workbook 对 象 ， 这 样 就 可 以 直接 对 已 存在 的 Excel 文件 进行 修改 了 。 

【 例 5-24】 使 用 xlutils 修改 Excel 文件 : 

import xlrd 

import xlutils.copy 

book = xlrd.open workbook(r'D:\xunlian\out.xls',formatting info=True) 

wtbook = xlutils.copy.copy (book) 

wtsheet = wtbook.get sheet (0) 


wtsheet .write(0, 0, "it has been changed.") 
Wwtbook.save (r'D:\xunlian\out.xls') 


将 上 述 代 码 放 入 一 个 程序 中 ， 运 行 后 ， 可 以 得 到 图 5-4 所 示 的 out.xls 文件 。 


» outxls. 


页 面 布 局 公式 数据 市 阅 视图 Team QQ 











outl @ ‘ r 
就 绪 国 四 和 -一 人 一 一 + 100% 


图 5-4 例 5-24 的 运行 结果 
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普 注意 : 
@ 调用 xlrd.open workbook() 时 ， 如 果 不 指定 formatting info=True， 那 么 修改 后 整个 
文档 的 样式 会 丢失 。 对 一 个 单元 格 进行 write 操作 时 ， 如 果 不 指定 样式 ， 也 会 将 
原来 的 样式 丢失 。 

@@ ”注意 调用 copy() 的 方法 。 也 可 以 通过 声明 from xlutils.copy import copy 来 直接 调 
用 copyO。 


5.5 HTML 文件 


HTML 是 超 文 本 标记 语言 Hyper Text Markup Language 的 缩写 ， 它 通过 标记 符 来 标记 
要 显示 的 网 页 中 的 各 个 部 分 。 网 页 文件 本 身 是 一 种 文本 文件 ， 通 过 在 文本 文件 中 添加 标记 
符 ， 可 以 告诉 浏览 器 如 何 显示 其 中 的 内 容 ， 如 怎样 显示 内 容 、 如 何 布局 等 。 

本 节 用 Beautiful Soup(Python 的 一 个 库 ) 来 操作 HIML 文件 ，Beautiful Soup 最 主要 的 
功能 是 从 网 页 中 抓 取 数 据 。 


5.5.1 ” ”Beautiful Soup 安装 


在 这 里 ， 我 们 推荐 使 用 Beautiful Soup 4， 不 过 它 已 经 被 移植 到 BS4 了 ， 也 就 是 说 ， 
我 们 需要 使 用 import bs4 命令 导入 BS4， 所 以 ， 这 里 我 们 用 的 版 本 是 Beautiful Soup 4.6.0 
(简称 BS4)。 

可 以 利用 pip 来 安装 Beautiful Soup。 其 方法 是 :下载 后 级 为 .whl 的 Beautiful Soup 安 
装 包 ， 在 DOS 命令 提示 符 窗口 下 进入 Python 安装 位 置 的 Scripts 文件 夹 ， 将 安装 包 复制 到 
此 文件 夹 下 ， 再 在 命令 提示 符 窗口 下 运行 以 下 命令 : 

pip install beautifulsoup4-4.6.0-py3-none-any.whl 

接 下 来 需要 安装 lxml。 其 方法 是 : 下 载 对 应 系统 和 版 本 的 安装 包 ， 如 后 级 名 为 .whl， 
运行 pip install name.whl 即 可 ; 如 后 缀 名 为 .exe， 运 行 easy_install name.exe 即 可 。 

Beautiful Soup 支持 Python 标准 库 中 的 HTML 解析 器 ， 同 时 也 支持 一 些 第 三 方 的 解析 
器 ， 如 果 没 有 安装 第 三 方 解 析 器 ， 则 Python 会 使 用 默认 的 解析 器 ， 但 lxml 解析 器 功能 更 
加 强大 ， 速 度 也 更 快 。 


5.5.2 ”创建 Beautiful Soup 对 象 


欲 创建 Beautiful Soup 对 象 ， 首 先 需要 从 bs4 中 导入 BeautifulSoup 模块 ， 使 用 的 命令 为 : 
from bs4 import Beautifulsoup 

创建 Beautiful Soup 对 象 时 ， 既 可 以 直接 创建 ， 也 可 以 通过 本 地 的 HIML 文档 间接 创建 。 
1. 直接 创建 Beautiful Soup 对 象 

使 用 : 


soup = BeautifulSoup (htm]l) 





























.HA 
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该 语句 可 直接 由 网 页 字符 串 创建 Beautiful Soup 对 象 (html 是 字符 串 ， 其 内 容 为 网 页 文 
本 )， 也 可 先 使 用 urllib 模块 的 urllibrequesturlopen(ur) 方 法 打开 url 网 页 ， 再 通过 
BeautifulSoup(html) 方 法 创建 Beautiful Soup 对 象 。 例 如 : 


>>》 import urllib. request 
>>> from bs4 import BeautifulSoup 
>>》url = ’https://baike. baidu. com 
>>> html = urllib. request. urlopen (ur1) 
>>> print (html) 
《http. client. HTTPResponse object at Ox000002AA693BD278> 
>>> soup = BeautifulSoup(html, “html. parser ) 
>>》 print (soup. prettify()) 
<!DOCTYPE html> 
<!—STATUS OK 一 > 
<html> 
‘<head> 
《meta charset="utf-8"/> 
《meta content="IE=Edge” http-eauiv="X-UA 
《meta content="always” name="referrer”/》 
<meta content=“ 百 度 百 科 是 一 部 内 容 开 放 、 自 由 的 网 络 百科 全 书 ， 旨 在 创造 一 个 涵盖 所 有 
领域 知识 ， 服 务 所 有 互联 网 用 户 的 中 文 知识 性 百科 全 书 。 在 这 里 你 可 以 参与 词 条 编辑 ， 分 享 页 
陨 估 办 知 识 。 name= “ description /> 


“ 肝 民 名 和 |_ 全 球 最 大 中 文 百科 全 书 
/title> 


其 中 ，prettify0 方 法 的 作用 是 格式 化 soup 对 象 的 内 容 。 
2. 通过 本 地 HTML 文档 间接 创建 Beautiful Soup 对 象 
使 用 本 地 HTML 文档 index.html 创建 Beautiful Soup 对 象 的 代码 为 : 


a = open('index.html') 
soup = BeautifulSoup (a) 


【 例 $-25】 使 用 本 地 HTML 文档 创建 BeautifulSoup 对 象 。 
有 下 面 一 段 HTML 文档 (存放 在 D:\xunlian 目录 下 ， 文 件 名 为 hello.htm)): 


是 DocTYPE htm] 且 
<html> 
<head> 
<meta charset-"UTF-8"> 
<title>Hello World!</title> 
</head> 
<body> 
<P class="title" name="hey"><b>it's a fantastic place</b> 
<a href-"http://something.com/elsie" class-"sister" id-"linkl"><!-— Elsie --></a> 
</p> 
</body> 
</html> 


将 上 面 的 HTML 文档 格式 化 输出 的 代码 及 其 运行 结果 如 下 : 


>>> from bs4 import BeautifulSoup 
>>> a = open(r’D:\xunlian\hello. html ) 
>>> soup = BeautifulSoup(a) 
>>》 print (soup. prettify()) 
<!DOCTYPE html> 
<html> 
head> 
<meta charset="“utf-8"/> 
<title> 
Hello Worldl 
</title> 
</head> 
<body> 
<p class="title” name="hey”> 
<b> 











Dn 这 


it’s a fantastic Place 
</b> 
<a class="sister” href=”http://something. com/elsie” id=”link1”> 
MS 
</a> 
</p> 
</body> 
</html> 
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5.5.3 解析 HTML 文件 


Beautiful Soup 将 复杂 的 HTML 文档 转换 成 一 个 复杂 的 树 形 结构 ， 每 个 节点 都 是 


Python 对 象 ， 所 有 对 象 可 以 归纳 为 以 下 4 种 : 


© Tag。 

@ NavigableString。 

© BeautifulSoup。 

®@ Comment。 

1. Tag 

通俗 地 说 ，Tag 就 是 HTML 中 的 标签 。 例 如 ， 对 于 如 下 title 标签 而 言 : 
<title>Hello World! </title> 


Tag 指 的 就 是 首尾 标志 加 上 中 间 的 内 容 。 下 面 的 例子 展示 了 如 何 使 用 Beautiful Soup 


来 获取 Tag。 


【 例 5-26】 获 取 title 标签 和 head 标签 : 
>>> print(soup. title) 
《title>Hello World!</title> 

>>> print (soup. head) 

《head> 

《meta charset= "utf-8"/> 
<title>Hello World!</title> 
《/head> 


使 用 “soup. 标 签名 ”可 以 轻松 地 获取 指定 的 标签 ， 不 过 找到 的 是 符合 要 求 的 第 一 个 标 


。 要 查找 符合 要 求 的 所 有 标签 ， 可 采用 本 节 最 后 介绍 的 find_all0 方 法 。 


Tag 有 两 个 重要 的 属性 : name 和 attrs， 下 面 通过 两 个 例子 说 明 一 下 如 何 获取 。 
【 例 5-27】 获 取 name 属性 : 


>>> print (soup. name) 
[document] 

>>> print (soup. head. name) 
head 


soup 对 象 本 身 比 较 特殊 ， 它 的 name 即 为 [document]， 对 于 其 他 内 部 标签 ， 输 出 的 值 便 


为 标签 本 身 的 名 称 。 


【 例 5-28】 获 取 attrs 属性 : 
>>> print (soup. p. attrs) 
{class’: [title’], 'name’: 'hey’} 


在 这 里 ， 我 们 把 p 标签 的 所 有 属性 显示 出 来 ， 得 到 的 类 型 是 一 个 字典 。 若 想 单独 获取 


某 个 属性 ， 例 如 获取 class， 可 以 这 样 写 : 


>>> print(soup.p[ class ]) 
Ctitle’] 
或 者 使 用 get 方法 ， 传 入 属性 名 称 : 
>>> print (soup. p. get( class )) 
RE 可 
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2. NavigableString 
前 面 提 到 获取 标签 内 容 ， 这 里 介绍 一 下 如 何 获取 标签 内 部 的 文字 。 
【 例 5-29】 获 取 标 签 内 部 文字 : 


>>> print (soup. b. string) 
it s a fantastic place 


标签 内 部 文字 类 型 为 一 个 NavigableString， 即 可 以 遍历 的 字符 串 。 
3. BeautifulSoup 


BeautifulSoup 对 象 表示 的 是 一 个 文档 的 全 部 内 容 ， 大 多 数 情况 下 ， 可 以 把 它 当 作 Tag 
对 象 ， 它 是 一 个 特殊 的 Tag， 我 们 可 以 分 别 获 取 它 的 类 型 、 名 称 以 及 属性 。 


【 例 S-30】 获 取 BeautifulSoup 对 象 的 类 型 、 名 称 和 属性 : 
>>> print (type (soup. name)) 

《class ' str > 

>>> print (soup. name) 

[document] 

> print (soup. attrs) 





4. Comment 


Comment 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 ， 其 实 输出 的 内 容 仍 然 不 包括 注 
释 符号 ， 但 是 如 果 不 好 好 处 理 它 ， 可 能 会 给 文本 处 理 带 来 意 想 不 到 的 麻烦 。 


【 例 5-31】 使 用 comment 对 象 获取 标签 信息 和 属性 : 
>>> print (soup. a) 
<a i href="http://something. com/elsie” id=”linkl1”»<!-- Elsie 
-—>2</a> 
>>> print (soup. a. string) 

Elsie 
>>> print (type (soup. a. string)) 
<class 'bs4.element. Comment > 


a 标签 里 的 内 容 实际 上 是 注释 ， 但 是 ， 如 果 利用 .string 来 输出 它 的 内 容 ， 我 们 就 会 发 
现 ， 它 已 经 把 注释 符号 去 掉 了 。 

前 已 提 及 ， 简 单 的 “soup. 标 签名 ”只 能 获取 第 一 个 符合 要 求 的 标签 。 本 节 最 后 介绍 一 
下 find_all0 方 法 ， 用 来 搜索 符合 条 件 的 所 有 标签 ， 并 返回 一 个 列表 。 

find_all0) 方 法 的 语法 格式 为 : 


find all (name, attrs, recursive, text, limit, **kwargs) 


各 参数 的 含义 如 下 。 

name: 查找 所 有 名 字 为 name 的 tag。 此 参数 可 以 为 字符 串 、 正 则 表达 式 、 列 表 、True 
和 方法 。 

attrs: 可 以 用 一 个 字典 的 形式 指定 。 

recursive: 默认 为 Tme， 检 索 当 前 tag 的 所 有 子孙 节点 ; 若 指定 为 False， 则 只 检索 一 
级 子 节点 。 

text: 用 于 指定 待 搜索 字符 串 的 内 容 ， 也 可 支持 name 参数 的 几 种 形式 ， 但 其 返回 的 不 
是 对 象 列表 而 是 文本 列表 。 若 name 和 text 两 个 参数 同时 出 现 ， 则 text 会 作为 name 的 一 个 
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附加 条 件 ， 返 回 的 还 是 带 标签 的 列表 。 

limit: 当 HTML 文档 太 大 时 ， 搜 索 会 很 慢 。 如 果 我 们 不 需要 搜索 到 所 有 的 结果 ， 可 使 
用 limit 参数 限制 返回 结果 的 数量 。 

**kwargs: 关键 字 参 数 。 

【 例 5-32】 使 用 find L all0 方 法 搜索 所 有 符合 条 件 的 标签 或 文本 : 


>> soup. find_all( b’ #name 为 字符 囊 形式 
[<b>it s a fantastic ee /b>] 

>>> import re 
?>》 soup. find_all (re. compile(  )) #name 为 正则 表达 式 形式 
L<bogy> 


a I sister” Res http:/ 和 Com/ ee 法 ink > 一 plsie 


环 /a 
</ hooy <b》it s a fantastic TE /b>] 
29> soup. find all(['a,'p ]) #name 为 列表 形式 


[<p class="title” name=’ “hey”; dey >it’s a fantastic place</b> 
<a =“sister” href="http://something. com/elsie” id="linkl”>¢!-— Elsie 






>it’s,a fantastif | ee a Ee sister” href="http://someth 
. com/elsie” id="link1”>¢!— 
>>> soup. find all(attrs={" 证 i Eh 年 :re. compile( htztp' )]) fattrs 
[ea Classr sister” href- http://something con/elsie” id="link1”>C!— Elsie 
一 2C/a 

>> ou find all(text=“Hello World!“) #text 参 数 
Hello Worldr ] 


>> soup. find_all(id=" linkl ) # 关 键 字 参数 。 
区 Ny class="sister” href="http://something. com/elsie” id="link1”)C!-—— Elsie 
一 /ay 


5.6 XML 文件 


XML 是 可 扩展 标记 语言 eXtensible Markup Language 的 缩写 ， 其 中 的 标记 是 关键 部 
分 。 相 对 于 HTML 文件 来 说 ，XML 更 注重 数据 内 容 ， 用 来 传输 和 存储 数据 。 

我 们 可 以 先 创建 内 容 ， 然 后 使 用 限定 标记 来 标记 它 ， 从 而 使 每 个 单词 、 短 语 或 块 成 为 
可 识别 、 可 分 类 的 信息 。 


5.6.1 解析 XML 文件 


在 Python 标准 库 中 ， 有 三 种 方式 来 解析 XML， 分 别 说 明 如 下 。 

(1) SAX(Simple API for XML): xmlsax 模块 实现 的 是 SAX API， 虽 然 速度 和 内 存 占 
用 方面 有 了 很 大 提高 ， 但 是 失去 了 便捷 性 。SAX 使 用 事件 驱动 模型 ， 在 解析 过 程 中 ， 通 过 
触发 事件 并 调用 用 户 定义 的 回调 函数 来 处 理 XML 文件 。 其 特点 是 速度 较 快 ， 占 用 内 存 比 
较 少 。 

(2) DOM(Document Object Model): 将 XML 数据 在 内 存 中 解析 成 一 棵 树 ， 即 DOM 
在 处 理 之 前 必须 把 基于 XML 文件 生成 的 树 状 数据 置 于 内 存 ， 通 过 对 树 的 操作 来 操作 
XML。xml.dom 提供 了 几 个 模块 ， 各 模块 性 能 也 有 所 不 同 。 其 特点 是 速度 较 慢 ， 耗 内 存 。 

(3) ElementTree( 元 素 树 ): ElementTree 就 像 一 个 轻 量 级 的 DOM， 具 有 方便 友好 的 
API。 其 特点 是 代码 可 用 性 好 ， 速 度 快 ， 消 耗 内 存 少 。 

综合 以 上 三 种 方式 的 特点 ， 推 荐 使 用 ElementTree 方式 解析 XML。ElementTree 提供 
了 两 个 对 象 将 a 文档 解析 成 树 : ElementTree 将 整个 XML 文档 转化 为 树 ，Element 则 
代表 树 上 的 单个 节点 。 对 整个 XML 文档 的 交互 ( 读 取 、 写 入 、 查 找 ) 一 般 是 在 ElementTree 
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进行 的 ， 对 单个 XML 元素 及 其 子 元 素 ， 则 是 在 Element 层面 进行 的 。 








下 面 介绍 如 何 利用 ElementTree 解析 XML。 
【 例 $-33】 本 节 用 到 的 XML 文件 内 容 如 下 : 


























- OO 
[Dveunlian\myxmlyaml 也 -6 并 Diunlian\myxmlyml d 
入 
<?xml version="1.0"?> 
- <doc> 
<branch hash="2g67ed90" name="codingpy.com"> textO1,source </branch> 
- <branch hash="h34900em" name="free00"> 
<sub-branch name="subfree00"> xml,sgml </sub-branch> 
</branch> 
<branch name="invalid"> </branch> 
</doc> v 
y yr pp 
将 下 述 代码 放 入 一 个 程序 中 ， 以 便 运行 : 
# 首 先 ， 加 载 文档 


import xml.etree.ElementTree as ET 
t = ET.ElementTree (file=r'D:\xunlian\myxml .xml') 
# 获 取 根 元 素 (root element) 
七 .getroot () 
# 查 看 根 元 素 的 属性 
root=t .getroot () 
print (root.tag, root.attrib) 
# 饥 历 根 元 素 的 子 元 素 
for child of root in root: 
print (child of root.tag, child of root.attrib) 
# 使 用 索引 访问 特定 子 元 素 
print (root[0] .tag, root[0] .text) 
# 查 找 XML 文档 中 所 有 元 素 ， 利 用 Element 对 象 中 iter 方法 实现 
for elem in t.iter(): 
print (elem.tag, elem.attrib) 
# 使 用 iter 方法 任意 遍历 某 一 tag 
for elem in t.iter(tag='branch'): 
print (elem.tag,elem.attrib) 
# 使 用 XPath 查找 元 素 ，Element 对 象 中 有 一 些 find 方法 接受 XPath 路 径 或 某 一 属性 为 参数 
for elem in 七 .iterfind('branch/sub-branch') : 
print (elem.tag,elem.attrib) 
for elem in t.iterfind("branch[@name='free00']"): 
print (elem.tag,elem.attrib) 


;二 人 
运行 结果 如 下 : 

doc 和 

branch {name’ : 'codingpy. com , ， hash’ : “2g67ed90 } 
branch {name’: ‘free00 , “hash :“h34900em } 
branch {name’ : “invalid } 

branch 

text01, source 


doc 了 

branch {name’: "codingpy. com’, “hash : '2g67ed90’} 
branch {name’: 'free00 , "hash' : 'h34900em } 
sub-branch { name’ : ”subfree00 } 

branch { name' : ' invalid’} 

branch { name' : "codingpy. com’, 'hash’ : ' 2g67ed90’} 
branch {name’: “free00 , “hash :“h34900em } 
branch {name’ :“invalid } 

sub-branch { name' : ' subfree00' } 

sub-branch {name’ : ’ subfree00’} 


需要 注意 的 是 ，iterfind 方法 会 返回 一 个 匹配 所 有 元 素 的 迭代 器 。ElementTree 中 还 有 
(aN. 
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find 方法 和 findall 方法 ，find 方法 会 返回 第 一 个 与 XPath(XPath 是 一 门 在 XML 文档 中 查找 
信息 的 语言 ， 使 用 路 径 表 达 式 在 XML 文档 中 选取 节点 ) 匹 配 的 子 元 素 ，findall 方法 以 列表 
形式 返回 所 有 匹配 的 子 元 素 。 


5.6.2 ”创建 XML 文件 


本 节 介 绍 如 何 利用 ElementTree(ET) 完 成 XML 文档 的 构建 。ElementTree 对 象 的 write 
方法 就 可 以 实现 这 个 需求 。 

一 般 来 说 ， 有 两 种 主要 使 用 场景 。 一 是 先 读 取 一 个 XML 文档 进行 修改 ， 然 后 再 将 修 
改写 入 文档 ， 二 是 从 头 创建 一 个 新 XML 文档 。 

【 例 5-34】 通 过 Element 来 修改 上 例 中 的 XML 文档 : 


import xml.etree.ElementTree as ET 
t = ET.ElementTree (file=r'D:\xunlian\myxml .xml') 
root = 七 .getroot () 
del root [21] 
root [0] .set('foo','bar') 
for subelem in root: 
print (subelem.tag, subelem.attrib) 
t.write(r'D:\xunlian\myxml .xml') 


将 上 述 代码 放 入 一 个 程序 中 ， 运 行 结果 为 : 

branch {name’ : “codingpy. com , 'hash’ : ”2g67ed90" ， "foo  : “bar } 

branch {name’ : ’free00 , “hash' : ’h34900em } 

>>> 

在 上 面 的 代码 中 ， 我 们 删除 了 root 元 素 的 第 三 个 子 元 素 ， 为 第 一 个 子 元 素 增加 了 新 属 
这 个 树 可 以 重新 写 入 文件 中 。 最 终 的 XML 文档 如 图 5-5 所 示 。 




















[ Dxxunlianmyxmlxml Po Dvwunlianmyxmlxml x 3 @ 


<?xml version="1.0"?> 
- <doc> 
<branch name="codingpy.com" hash="2g67ed90" foo="bar"> textO1,source </branch> 
- <branch name="free00" hash="h34900em"> 
<sub-branch name="subfree00"> xml,sgml </sub-branch> 
</branch> 
</doc> 


图 5-5 例 5-34 的 运行 结果 


如 果 是 从 头 构建 一 个 完整 的 文档 ，ElementTree 模块 提供 了 一 个 SubElement 工厂 函 
使 创建 元 素 的 过 程 变 得 很 简单 。 
【 例 5-35】 使 用 SubElement 函数 构建 XML 文档 : 


import xml.etree.ElementTree as ET 
a = ET.Element ('elem') 

= ET.SubElement (a, 'child1') 
text = "sometext’" 
ET.SubElement (a, 'child2"') 
ET.SubElement (d, 'elem b') 


凑 


c 
Cc 
dq 
b 
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root = ET.Element ('root') 

root .extend( (a,b)) 

tree = ET.ElementTree (root) 
tree.write(r'D:\xunlian\first.xml') 


将 上 述 代码 放 入 一 个 程序 中 ， 生 成 的 XML 文档 如 图 5-6 所 示 。 





三 如 x 
LL] Di\xunlianVfirst.xml Pro 您 DixunlianVfirstxml 
八 
<?xml version="1.0"?> 
- <root> 
- <elem> 
<child1>sometext</child1> 
- <child2> 
<elem_b/> 
</child2> 
</elem> 
<elem_b/> 
</root> A 
图 5-6 例 5-35 的 运行 结果 
已 党 
5.7 异常 处 理 
5.7.1 异常 


异常 是 一 个 事件 ， 此 事件 会 在 程序 执行 过 程 中 发 生 ， 影 响 程序 的 正常 执行 。 一 般 情况 
下 ，Python 在 无 法 正常 处 理 程序 时 就 会 产生 异常 。 

Python 用 异常 对 象 (exceptionobject) 表 示 异 常情 况 。 当 发 生 异 常 时 ， 我 们 需要 捕捉 它 ， 
否则 程序 会 用 回溯 (traceback) 的 方式 停止 运行 。 

在 Python 中 ， 标 准 异常 情况 如 表 5-4 所 示 。 





























表 5-4 异常 情况 
名 称 说 明 

BaseException 所 有 异常 的 基 类 
SystemExit 解释 器 请 求 退出 
KeyboardInterrupt 用 户 中 断 执行 (通常 是 输入 ^C) 
Exception 常规 错误 的 基 类 
StopIteration 和 迭代 器 没有 更 多 的 值 
GeneratorExit 生成 器 (generator) 发 生 异 常 来 通知 退出 
ArithmeticError 所 有 数值 计算 错误 的 基 类 
FloatingPointError 浮 点 计算 错误 
OverflowError 数值 运算 超出 最 大 限制 
ZeroDivisionError 除 (或 取 模 ) 零 (所 有 数据 类 型 ) 
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名 称 说 明 
AssertionError 断言 语句 失败 
AttributeError 对 象 没有 这 个 属性 
EOFError 没有 内 建 输入 ， 到 达 EOF 标记 
EnvironmentError 操作 系统 错误 的 基 类 
IOError 输入 /输出 操作 失败 
OSError 操作 系统 错误 
WindowsError 系统 调用 失败 
TmportError 导入 模块 /对 象 失 败 
LookupError 无 效 数据 查询 的 基 类 
IndexError 序列 中 没有 此 索引 (index) 
KeyError 映射 中 没有 这 个 键 
MemoryError 内 存 溢 出 错误 (对 于 Python 解释 器 不 是 致命 的 ) 
NameError 未 声明 /初始 化 对 象 (没有 属性 ) 
UnboundLocalError 访问 未 初始 化 的 本 地 变量 
ReferenceError 弱 引 用 (Weakreference) 试 图 访问 已 经 垃圾 回收 了 的 对 象 
RuntimeError 一 般 的 运行 时 错误 
NotImplementedError 尚未 实现 的 方法 
SyntaxError Python 语法 错误 
IndentationError 缩 进 错误 
TabError Tab 和 空格 混用 
SystemError 一 般 的 解释 器 系统 错误 
TypeError 对 类 型 无 效 的 操作 
ValueError 传 入 无 效 的 参数 
UnicodeError Unicode 相关 的 错误 
UnicodeDecodeError Unicode 解码 时 的 错误 
UnicodeEncodeError Unicode 编码 时 错误 
UnicodeTranslateError Unicode 转换 时 错误 
Warning 警告 的 基 类 
Deprecation Warning 关于 被 弃 用 的 特征 的 警告 
FutureWaming 关于 构造 将 来 语义 会 有 改变 的 警告 
PendingDeprecationWarning 关于 特性 将 会 被 废弃 的 警告 
Runtime Warning 可 疑 的 运行 时 行为 (runtimebehavion) 的 警告 
SyntaxWaming 可 疑 的 语法 的 警告 
UserWarning 用 户 代码 生成 的 警告 
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5.7.2 try、else、finally 语句 


捕捉 异常 可 以 使 用 try、except、else、finally 语句 。 

try/except 语句 用 来 检测 try 语句 块 中 的 错误 ， 从 而 使 except 语句 捕捉 异常 信息 并 处 
理 ， 若 使 程序 不 会 在 异常 发 生 时 就 停止 运行 ， 只 需 在 try 中 捕捉 它 。 

try/except/else 的 语法 如 下 : 


二 工 Wi 

< 语句 > 坦 运行 别 的 代码 
except <name :> 

< 语句 > 如 果 在 try 部 分 引发 了 name 异常 
except <name>,< 数 据 :> 

< 语句 > # 如 果 引 发 了 name 异常 ， 获 得 附加 的 数据 
人 JS 

< 语句 > # 如 果 没 有 异常 发 生 
finally: 

< 语句 > # 不 管 try 子 句 内 部 是 否 有 异常 发 生 ， 都 会 执行 语句 
try 语句 的 工作 流程 如 下 。 


(1) 当 遇 到 一 个 try 语句 后 ，Python 就 在 当前 程序 的 上 下 文 做 标记 ， 当 出 现 异 常 时 可 
以 较 快 地 回 到 这 里 ， 再 执行 try 子 句 ， 然 后 执行 什么 取决 于 运行 过 程 中 是 否 出 现 异常 。 

(2) 如 果 当 try 后 的 语句 执行 时 发 生 异 常 ，Python 就 跳 回 到 try 并 执行 第 一 个 匹配 该 异 
常 的 except 子 句 。 异 常 处 理 完毕 后 就 继续 运行 (除非 在 处 理 异 常 时 又 引发 新 的 异常 )。 

(3) 如 果 在 try 后 的 语句 里 发 生 了 异常 ， 却 没有 匹配 的 except 子 句 ， 异 常 将 被 提交 到 
上 层 的 ty， 或 者 到 程序 的 最 上 层 ( 这 样 将 结束 程序 ， 并 显示 默认 的 出 错 信息 )。 

(4) 如 果 在 try 子 句 执行 时 没有 异常 发 生 ，Python 将 执行 else 语句 后 的 语句 (如 果 有 
else 的 话 )， 然 后 程序 通过 整个 try 语句 并 继续 运行 。 

(5) 不 论 是 否 发 生 异 常 ，finally 子 句 一 定 会 被 执行 。 

【 例 5-36】 使 用 try/except 关键 字 捕捉 异常 

Ey 

print (8/0) 


except ZeroDivisionError: 


print (' 除 数 不 能 为 0') 
Wo 个 程序 中 ， 运 行 结果 为 : 
> | 
一 个 except 语句 只 能 捕捉 其 后 声明 的 异常 类 型 ， 但 如 果 抛 出 的 是 其 他 类 型 的 异常 ， 就 
需要 再 增加 一 个 except 语句 了 。 当 然 ， 也 可 以 指定 一 个 更 加 通用 的 异常 类 型 ， 比 如 
Exception。 除 了 声明 多 个 except 语句 外 ， 也 可 以 在 一 个 except 语句 中 将 多 个 异常 作为 元 组 
列 出 来 。 
【 例 5-37】 捕 捉 多 个 异常 ， 并 将 多 个 异常 以 元 组 形式 列 出 : 


ry: 
print (8/'0') 




















-( 151 \. 


mm Python 程序 设计 实用 教程 


except (ZeroDivisionError, Exception): 


print (' 发 生 了 一 个 异常 ') 


将 上 述 代码 放 入 一 个 程序 中 ， 运 行 结果 为 : 
发 年 了 一 个 异常 


使 用 finally 子 句 时 ， 不 管 try 子 句 内 部 是 否 有 异常 ， 都 会 执行 finally 子 句 ， 所 以 
finally 子 句 用 于 关闭 文件 或 网 络 套 接 字 (第 12 章 介绍 ) 时 会 非常 有 用 。 在 同一 条 语句 中 可 以 
组 合 使 用 try、except、finally 和 else。 

【 例 5-38】 组 合 使 用 try/except/else/finally 子 句 进行 异常 处 理 : 


让 对 
print (8/'0') 
except (ZeroDivisionError, Exception): 
print (' 发 生 了 一 个 异常 ') 
else: 
print (' 正 常 运行 ') 
finally: 
print('cleaning up') 


将 上 述 代 码 放 入 一 个 程序 中 ， 运 行 结果 为 : 
发 生 了 一 个 异常 


cleaning up 
>>> | 


5.7.3 ”触发 异常 和 自 定义 异常 


异常 可 以 在 某 些 地 方 出 错时 自动 引发 ， 下 面 介绍 一 下 如 何 自 己 引发 异常 ， 并 且 介 绍 一 
下 如 何 创建 自己 的 异常 类 型 。 
在 Python 中 使 用 raise 关键 字 触 发 异常 : 


def ThorwErr(): 

raise Exception(" 抛 出 一 个 异常 ") 
#Exception: 抛 出 一 个 异常 
ThorwErr () 


raise 关键 字 触 发 的 是 一 个 通用 的 异常 类 型 (Exception)， 一 般 来 说 ， 触 发 的 异常 越 详细 
越 好 ，Python 中 内 建 了 很 多 异常 类 型 ， 可 以 通过 dir 函数 查看 异常 类 型 。 
【 例 5-39】 使 用 dir 函数 查看 Python 内 建 模块 builtins 中 的 异常 类 型 : 


>>> import builtins 

>>> dir (builtins) 
[ArithmeticError” ; "AssertionError , ”AttributeError 了 "BaseException - 
BlockingIOError’ ， BrokenPipeError’ , "BufferError 3 "BytesWarning ， "Child 
ProcessError’ ， " ConnectionAbortedError’, ”ConnectionError , ConnectionRef 
usedError’ » "ConnectionResetError 5 ”DeprecationWarning ， EOFError’, "El11 
ipsis’, ”EnvironmentETToT ， "Exception ， "False’, "FileExistsError ， "Pile 
NotFoundError’ 3 " FloatingPointError” y "FutureWarning , GeneratorExit" a 
OError’ > “ImportETTOT ， ImportWarning’ , ‘ IndentationError’ ， "IndexError ， 
; InterruptedError ISADirectoryETTOT 证 “KeyError, ， ,KeyboardInterTupt, ， 
"LookupError ， "MemoryError ， ModuleNotFoundError , ”NameError ， "None ， 
,NotADirectoryError ， "NotImplemented , NotImplementedError ， "0SError ， 
”OverflowError ，” PendingDeprecationNWarning’ ，,PermissionError ，' ProcessL 
ookupError  ， ’ RecursionError’, ’ ReferenceError’, “ ResourceWarning’,, "Runti 
meError ，” RuntimeWarning' ，”StopAsyncIteration , ’StopIteration , 'Syntax 
Error’, , SyntaxWarning , "SystemError , ”SystemExit , ~ TabError’, ’ Timeout 
Error’, ’True’, "TypeError , "UnboundLocalError "UnicodeDecodeError ， 3 
nicodeEncodeError’, ‘UnicodeError’, “UnicodeTranslateError ， "UnicodeWarni 
ng’, "UserWarning’, ‘ValueError’, ‘Warning’, ‘WindowsError’, 'ZeroDivision 


Error ，” buildclass ’,’ debug “，” doc “，” import “，” loader 


152\. 


第 5 章 文件 与 异常 外 理 仇 因 要 琶 


这 里 我 们 只 截取 了 异常 类 部 分 ， 内 建 模块 builtins 还 包括 很 多 其 他 类 型 和 方法 。 
虽然 内 建 的 异常 类 已 经 包含 大 部 分 情况 ， 可 以 满足 很 多 要 求 ， 但 有 时 候 还 是 需要 创建 
自己 的 异常 类 (类 的 概念 在 第 6 章 中 介绍 )。 
在 Python 中 ， 可 以 自 定义 特殊 类 型 的 异常 ， 但 前 提 是 确保 从 Exception 类 继承 (不 管 是 
直接 继承 还 是 间接 继承 )。 
【 例 5-40】 自 定义 异常 类 : 


class SomeCustomException(Exception): 
pass 


5.7.4 使 用 sys 模块 返回 异常 


在 Python 中 ， 另 一 种 获取 异常 信息 的 方式 是 通过 sys 模块 中 的 exc_info0) 函 数 ， 此 函 
数 会 返回 一 个 三 元 组 : (异常 类 ， 异 常 类 的 实例 ， 跟 踪 记 录 对 象 )。 
【 例 5-41】 使 用 exc_info0 函 数 返 回 异常 : 
try: 
8/0 
except: 
import sys 
t = sys.exc info() 





print (七 ) 
ER 
print (i) 
将 上 述 代 码 放 入 一 个 程序 中 ， 运 行 结果 为 : 
(Cclass ' ZeroDivisionError’ >, ZeroDivisionError( division by zero’,), (tra 


ceback object at Ox0000023FFC730308>) 
<class“ZeroDivisionErTor > 

division by zero 

凡 object at Ox0000023FFC730308> 
>>> 


5.8 使 用 pdb 模块 调试 程序 


在 Python 中 ， 语 法 错误 可 以 由 Python 解释 器 发 现 ， 但 逻辑 错误 或 变量 使 用 错误 却 不 
容易 发 现 ， 若 结果 不 符合 预期 ， 则 需要 进行 调试 。1.2.3 小 节 曾 介绍 了 使 用 IDLE 自身 的 功 
能 调试 程序 的 方法 。 其 实 ，Python 自 带 的 pdb 模块 也 是 一 个 很 好 的 调试 工具 ， 使 用 它 可 以 
为 脚本 设置 断 点 、 单 步 执行 、 查 看 变量 值 等 。 

pdb 可 以 使 用 import 导入 ， 也 可 以 通过 命令 行 参数 方式 启动 。 

【 例 5-42】 使 用 dir 函数 查看 pdb 模块 的 内 建 函 数 : 


>>> import pdb 
>>> dir(pdb) 























[Pab'’, Restart’, "TESTOD’, ’ all_’, "builtins, ’ _cached ，“ 
Goes Ae "oader. ~ nam hackage 7 Bhoc 
_rstr’, '_usage’, ‘bdb’, 'cmd’, ‘code’, "dis ， find function’, 'getsource 
lines’, 'glob , 'help’, 'inspect’, 'lasti2lineno’, ’line prefix’, 'linecac 
he’, 'main’, ’os’, 'pm, 'post mortem’, 'pprint’, "re  ， ‘run’, 'runcall’, 
2 "runeval’, 'set trace’, 'signal , 'sys’, 'test’, "traceback ] 
>>> 
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5.8.1 常用 的 pdb 函数 


1. pdb.run() 函 数 
pdb.run() 函 数 主 要 用 于 调试 语句 块 ， 其 基本 语法 如 下 : 
run(statement, globals=None, locals=None) 


参数 含义 : statement - 要 调试 的 语句 块 ， 以 字符 串 形式 表示 。 
globals - 可 选 参数 ， 设 置 statement 运行 的 全 局 环境 变量 。 
locals - 可 选 参数 ， 设 置 statement 运行 的 局 部 环境 变量 。 
【 例 5-43】 使 用 pdb. run0 函 数 调试 语句 块 


import Epos 
pdb.run{'' 和 
for t in range(0,10,3): 
t += 2 
print (t) 
四 


> <string>(2)<module>() 

(Pdb) n 帮 (Pdb) 为 调试 命令 提示 符 ， 表 示 可 输入 调试 命令 
> <string>(3) <module>() 

10 (Pdb) n #0 表示 执行 下 一 行 

1 > <string>(4)<module>() 

12 Ee ) n # 程 序 循环 一 次 后 ， 输 出 一 个 结果 


四 下 amewme 


14 <string>(2) <module>() 

15 (Fdb) continue #continue 表 示 继 续 执行 程序 
160%5 

17 8 

1 


2.， pdb.runeval() 函 数 
pdb.runeval0 函 数 主要 用 于 调试 表达 式 ， 其 基本 语法 如 下 : 


runeval (expression, globals=None, locals=None) 


参数 含义 : expression - 要 调试 的 表达 式 。 
globals - 可 选 参数 ， 设 置 ER 运 运行 的 全 局 环境 变量 。 
locals - 可 选 参数 ， 设 置 expression 运行 的 局 部 环境 变量 。 
【 例 S-44】 使 用 pdb.runeval0 函 数 调试 表达 式 : 
import pdb 
pdb.runeval (' (3+5) *2 -6') # 使 用 runeval () 函数 调试 表达 式 '(3+5) *2 -6' 
> <string> (1) <module> () ->2 
(Pdb) n # 使 用 n 命 令 单 步 执行 
--Return—— 
> <string> (1) <module>() ->10 


(Pdb) n # 得 出 表达 式 的 值 
10 
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3. pdb.runcall() 函 数 
pdb.runcall0 函 数 主要 用 于 调试 ， 其 基本 语法 如 下 : 


runcall (*args, **kwds) 


参数 合 义 : args(kwds) - 函数 参数 。 
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【 例 5-45】 使 用 pdb.runcall0 函 数 调试 : 
Dimport pdb 

2 def sum(*args) : # 定 义 函 数 sum， 求 所 有 参数 之 和 
total = 0 

4 for value in args: 

5 total +- value 

6 return total 

7 pdb.runcall (sum, 2,4,6,8,10) # 使 用 runcall () 调试 函数 
3 > <stdin>(2)sum() 

9 (Pdb) n # 进 入 调试 状态 ， 单 步 执行 
10 > <stqin>(3)sum() 

11 (Pdb) n 

12 > <stdin>(4)sum() 

13 (Pdb) n 

14 > <stqin>(3)sum() 

15 (Pdb) n 

16 > <stdin>(4)sum() 

而 (Pdb) n 

18 > <stdin>(3)sum() 

19 (Pdb) n 

20 > <stdin>(4)sum() 

21 (Pdb) n 

22 > <stdin>(3)sum() 

23 (Pdb) n 

24 > <stdin>(4)sum() 

25% (Pdb) n 

26 > <stdin>(3)sum() 

2 (Pdb) n 

28 > <stdin>(4)sum() 

29 (Pdb) n 

30 > <stdin>(3)sum() 

351 (Pdb) n 

32 > <stdin>(5)sunm() 

33 (Pdb) n 

34 --Return-- 

35 > <stdin>(5)sum()->30 

36 (pdb) continue # 继 续 执行 

N30 # 函 数 最 后 返回 结果 


4. pdb.set_trace() 函 数 
pdb.set_ trace0 函 数 主 要 用 于 在 脚本 中 设置 硬 断 点 ， 其 基本 语法 如 下 : 


set trace() 


【 例 5-46】 使 用 pdb.set_trace0) 函 数 设置 硬 断 点 : 


工 import pdb 

2 

3 pdb.set trace() # 设 置 硬 断 点 

4 for i in range(6): 

5 i#= i 

6 print (i) 

7 > d:\project\pdb 04.py(4)<module>() 

Bi-> for i in range(6): 

9 (Pdb) list # 使 用 1ist 列 出 脚本 内 容 
10 al import pdb 

11 2 

12 3 pdb.set trace() 

43 4 -> for i in range(6): 

14 5 Pe 

15 6 print (i) 

16 [EOF] # 列 出 脚本 内 容 结 束 标 志 
17 (Pdb) continue # 继 续 执 行 ， 输 出 最 后 结果 
18 0 

El 

20 4 

S39 

S16 

E25 
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5.8.2 pdb 调试 命令 


pdb 模块 中 的 调试 命令 可 以 完成 单 步 执行 、 打 印 变量 值 、 设 置 断 点 


如 表 5-5 所 示 。 





等 功能 ， 主 要 命令 


表 5-5 pdb 模块 中 的 调试 命令 





























# 完 整 命令 描 述 
#args 打印 当前 函数 的 参数 
#break 设置 断 点 
#clear 清除 断 点 
#condition 设置 条 件 断 点 
eon 二 继续 运行 ， 直 到 过 到 断 点 或 者 脚本 结束 
#disable | 无 | 禁用 断 点 
#enable [无 | 启用 断 点 
jhelp |h | 大 邮 帮 助 
术 gnore | 天 | 忽略 断 点 
in |j | 跳 转 到 指定 行 运行 
#list 1 | 列 出 脚本 清单 
Hhext |n | 执行 下 条 语句 ， 过 到 函数 不 进入 其 内 部 
#print |。 [| 打 ep 变 量 值 
Hauit [| id 
执 etum lt | 一 直 运 行 到 函数 返回 
#break | 无。 [设置 临时 断 点 ， 断 点 只 中 断 一 次 
#step | 。 | 执行 下 一 条 语句， 过 到 函数 进入 其 内 部 
#where ER 查看 所 在 的 位 置 
机 | 无 | 在 pab 中 执行 语句 


【 例 $-47】 使 用 pdb 调试 命令 调试 程序 。 
首先 我 们 编写 一 个 求解 水 仙 花 数 的 程序 ， 然 后 
试 命令 进行 调试 。 


1 def narci_num{a,b) : 
2 for i in range(arb) : 


h = i//100 
d = i//10%10 
1 = i$10 
6 if i = hkk3 + dt+3 + UA#3: 
7 print (i) 


9 narci num(100,1000) 


调 出 调试 命令 行 ， 


使 用 表 5-5 所 示 的 调 


# 定 义 水 仙 花 数 函 数 


# 计 算 100-999 之 同 的 水 仙 花 数 


10 
11 d:\Project>python -m pdb pdb 05.py # 运 行 此 命令 进行 程序 调试 
12 > d:\Project\pdb 05.py(1)<module>() 

13 -> def narci num(a,b): 

14 | (Pdb) list #1ist 默 认 只 列 出 11 行 


.(A5e\， 


15 -> def narci num(a,b): 
16 for 1 in range(a,b): 
17 h = i//100 

18 = i//10%10 






u= i10 
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旨 1 行 后 如 有 代码 ， 可 以 使 用 '1 pagel1,page2' 列 出 
# 使 用 break 命 令 设 置 第 2 行为 断 点 
# 返 回 基点 编号 1 


if i = ht#3 + dxx*3 + Us3: 
21 print (i) 
22 
23 narci_num(100,1000) 
a 0 
2 11 
26 (Pdb) b 2 
2) Breakpoint 1 at d:\Project\pdb 05.py:2 
28 (Pdb) b 7 
29 Breakpoint 2 at d:\Project\pdb 05.py:7 
30 (Pdb) c 


31 > d:\Project\pdb 05.py(2)narci_num() 
2 -> for i in range(a,b): 

33° (Pdb) c 

34 > d:\Project\pdb 05.py(2)narci_num() 
35 -> for i in range(a,b): 

36 (Pdb) n 

37 > d;\Froject\pdb 05.py(3})narci num() 
38 -> h = i//100 

了 3 (Pdb) n 

40 > d:\Project\pdb_05.py(4)narci_num() 
-> d = i//10%10 

ga (Pdb) n 

43 > d:\Project\pdb 05.py(5)narci num() 
到 -> u = i$10 

45 (Pdb) n 

"> d:\Project\pdb 05.py(6)narci num() 
> if 1 == ha#3 + dA#3 + UX#3: 

40 (Pdb) n 

多 "> d:\Project\pdb 05.py(2}narci num() 
50 -> for i in range(a,b): 

51 (Pdb) pi 

52 101 

53 (Pdb) disable 2 


# 使 用 c 命 令 运行 脚本 


# 单 步 执行 


# 打 印 i 的 值 
# 禁 用 断 点 2 


54 Disabled breakpoint 2 at d:\Project\pdb_05.py:7 


55 (Fdb) c 

56 > d:\Project\pdb 05.py (2)narci_num() 
5] -> for i in range(arb): 

58 (Pdb) enable 2 


# 恢 复 断 点 2 


59 Enabled breakpoint 2 at d:\Froject\pdb 05.py:7 


0 (Pdb) c 

部 > d:\Project\pdb 05.py(2)narci_num() 
62 -> for i in range(a,b): 

63 (Pdb) cl 

64 Clear all breaks? y 


# 清 除 所 有 断 点 ， 输 入 y 确 认 


65 Deleted breakpoint 1 at d:\Proiect\pdb 05.py: 


655 Deleted breakpoint 2 at d:\Project\pdb 05.p. 


6 (Pdb) c 
566 1153 
69 370 
0371 
2190407 





2 
# 继 续 运 行 


了 2 The program finished and will be restarted 


9 > d:\Project\pdb 05.py(1) <module>() 
14 -> def narci num(a,b): 
5 (Pdb) q 


# 使 用 qd 命令 退出 pdb 调 试 


5.9 ”案例 实 训 : 文本 文件 的 操作 与 异常 处 理 


综合 前 面 所 学 内 容 ， 本 章 最 后 给 出 一 个 综合 性 实例 。 本 例 结 合 了 文本 文件 的 操作 与 异 
常事 件 的 处 理 ， 使 用 re.sub0 函 数 对 文本 文件 中 的 字符 串 进 行 蔡 换 ， 并 将 替换 后 的 内 容 存 入 


另 一 个 文本 文件 。 本 例 的 代码 如 下 : 


import re 
臣 2Y、 
infile = 


input ("请 输入 文本 文件 名 ( 含 完整 路 径 ) : ") 
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fl = open(infile,'r') 
outfile = input ("请 输入 另存 为 的 文件 名 ( 含 完整 路 径 ) : ") 
f2 = open (outfile,'w') 


sourcestr = input ("请 输入 要 蔡 换 的 原文 本 内 容 : ") 
targetstr = input ("请 输入 蔡 换 后 的 文本 内 容 : ") 
五 三 人 

RD 


# 读 取 源 文件 内 容 ， 逐 行 蔡 换文 本 内 容 ， 写 入 新 文件 ， 并 统计 蔡 换 次 数 。 
for line in fl.readlines() : 
Be 和 
if sourcestr in line: 朝 判 断 sourcestr 是 否 在 文本 行 中 
replace = re.subl(sourcestr, targetstr, line) 


# 将 sourcestr 蔡 换 为 targetstr， 写 入 行 数据 


n += line.count (sourcestr) # 统 计 蔡 换 次 数 
f2.write (replace) # 将 替换 后 的 文本 逐 行 写 入 新 文件 中 
Continue 

elif n != 0: 


f2.write (line) 
print ("第 $s 行 中 没有 要 替换 的 内 容 。"%p) 
elses 


print (" 要 蔡 换 的 内 容 不 存在 。") 


print ("替换 的 次 数 : ss"sn) 
except FileNotFoundError: # 捕 捉 文件 不 存在 的 异常 
print ("File not found.") 
except PermissionError: # 捕 捉 文件 权限 的 异常 
print ("You don't have permission to access this file.") 
finally: 
fl.close() 
f2.close() 
print ("End up.") 


在 try 子 句 中 ， 先 输入 蔡 换 前 后 文本 文件 的 完整 路 径 及 文件 名 ， 再 输入 需要 蔡 换 的 文 


本 以 及 蔡 换 后 的 文本 。 通 过 for 循环 逐 行 读 取 源 文件 内 容 ， 在 循环 内 首先 用 让 语句 判断 该 
行文 本 中 是 否 包 含 sourcestr， 若 包含 ， 则 继续 执行 ;使 用 sub0 函 数 替 换文 本 ， 统 计 蔡 换 次 
数 ， 并 向 新 文件 中 写 入 替换 后 的 文本 。 若 文件 中 存在 sourcestr， 但 某 行 中 不 存在 ， 则 执行 
elif 分 支 ， 将 当前 行 原文 本 写 入 新 文件 ， 并 输出 提示 信息 。 当 文件 中 不 存在 sourcestr 时 ， 
执行 else 分 支 ， 输 出 提示 信息 “要 替换 的 内 容 不 存在 ”。 当 输入 的 文件 路 径 或 文件 名 不 存 
在 时 ，except 语句 捕捉 FileNotFoundError 异常 ， 并 输出 提示 信息 。 因 文件 权限 问题 造成 无 
法 读 取 或 无 法 写 入 文件 时 ，except 语句 捕捉 PermissionError 异常 ， 输 出 提示 信息 。 无 论 是 
否 出 现 异 常 ， 最 终 都 会 执行 finally 子 句 并 输出 “End up.”。 





此 案例 中 ， 我 们 将 对 一 段 描写 抗日 战争 史 的 文字 进行 替换 ， 将 “ 八 年 抗战 ”替换 为 


“十 四 年 抗战 ”， 此 文件 保存 在 D:\test 目录 下 ， 文 本 内 容 如 下 : 
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国 testbt -记事 本 三 器， Xx 
文件 编辑 (日 格式 (OQ) 查看 0， 帮助 (H) 















































a 中 国人 民 进 行 的 八 年 反抗 日 本 帝国 主义 侵 
略 的 伟大 的 民族 革命 战争 ， 也 是 一 百 多 年 来 中 国人 民 反 对 外 敌 入 侵 第 次 取得 
完全 胜利 的 民族 解放 战争 ， et 有 社会 各 界 、 
各 族人 民 、 各 民主 党 派 、 抗 日 团体 、 社 会 各 阶层 爱国 人 士 和 海外 侨胞 广 演 参加 
的 全 民族 抗战 。 中 国 的 抗日 战争 是 第 二 次 世界 大 战 的 重要 组 成 部 分 。 

从 敌我 力量 发 展 变化 的 芒 势 来 看 。 中 国 八 年 抗战 及 其 胜利 ， 是 百 多 年 来 帝国 主 
i 成 为 中 华 民族 由 误 败 到 于 新 振 起 的 伟大 








第 一 种 情况 ， 蔡 换 “ 八 年 抗战 ”为 “十 四 年 抗战 ”， 并 将 替换 后 的 文本 保存 到 同一 目 


录 下 的 test0.txt 文件 中 。 运 行 结 果 如 下 : 
0 《 含 完整 路 径 ) : D:\test\test. txt 





请 输入 的 文件 名 〈 含 完整 路 径 ) : D:\test\test0. txt 
青 输入 要 蔡 换 的 原文 本 内 容 ; 八 年 
人 Lp 十 四 年 
End up. 
因为 原文 中 有 两 处 “ 八 年 ”， 故 替换 的 次 数 为 2， 蔡 换 成 功 。 





第 二 种 情况 ， 蔡 换 “ 基 础 ”为 “基石 ”， 因 原文 第 二 行 中 没有 蔡 换 内 容 ， 所 以 执行 一 
次 elf 分支， 运行 结果 如 下 : 
请 输入 文本 文件 名 人 D:\test\test. txt 


请 输入 另存 为 的 文人 ( 含 完整 路 径 ) : D:\test\testl. txt 
eA 容 ; 基础 


流 
Vall 
尘 洒 尘 
a 
”并 
ls 


es 种 情况 ， 要 蔡 换 的 字符 串 不 在 源 文件 中 ， 没 有 内 容 蔡 换 ， 所 以 新 文件 内 容 为 空 。 
运行 结果 如 下 : 





: D:\test\test. txt 
) : D:\test\test2. txt 


因为 原文 中 有 两 个 自然 段 ， 每 个 自然 段 以 换行 符 结束 ， 故 相当 于 两 “ 行 ”， 所 以 在 循 
环 过 程 中 ，else 语句 会 执行 两 次 ， 输 出 两 次 “要 蔡 换 的 内 容 不 存在 ”。 

第 四 种 情况 ， 输 入 的 源 文件 不 存在 ， 则 引发 FileNotFoundError 异常 ， 输 出 “File not 
found.”。 运 行 结果 如 下 : 

请 输入 文本 文件 名 《〈 含 完整 路 径 ) : D:\test\hello. txt 


File not found. 
End up. 


第 五 种 情况 ， 因 文件 权限 问题 引发 PemmissionError 异常 ， 因 运行 此 例 的 电脑 C 盘 文 件 


有 写 权限 ， at Pcl alli 运行 结果 如 下 : 
请 输入 文本 文件 完整 路 径 ) : D:\test\test. txt 
请 输入 中 并 的 入 作客 “( 含 完整 路 径 ) ， C:Ntest txt 
You don t have permission to access this file. 
End up. 
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本 章 小 结 


本 章 首 先 介 绍 了 通过 文件 对 象 和 os、shutil 模块 中 的 方法 对 文件 和 目录 进行 读 写 等 操 
作 ; 其 次 介绍 了 对 4 种 特殊 文件 的 操作 ， 即 一 一 使 用 CSV 包 对 CSV 文件 进行 读 写 操作 ， 
使 用 xlkrd、xlwt 和 xlutils 库 读 写 与 修改 Excel 文件 ， 使 用 Beautiful Soup 库 解 析 HTML 文 
档 ， 以 三 种 方式 解析 XML 文档 以 及 利用 ET 构建 XML 文档 ; 然后 介绍 了 Python 的 标准 
异常 对 象 ， 捕 捉 异 常 的 ty、else、finally 语句 ， 使 用 raise 关键 字 触 发 异常 ， 用 户 自 定义 异 
常 类 等 ， 最 后 介绍 了 使 用 pdb 模块 调试 程序 ， 以 及 常用 的 pdb 函数 和 调试 命令 。 


习 题 

1. 填空 题 

(1) 获取 文件 指针 的 方法 是 ( )， 当 偏 移 相 对 位 置 为 ( ) 时 ，offset 必须 为 0 
或 正 数 。 

(2) os 模块 和 shutil 模块 都 有 删除 目录 的 方法 ， 其 中 ，( ) 只 能 删除 空 目 录 ， 而 
( ) 对 空 目录 和 非 空 目 录 均 可 删除 。 

(3) 使 用 Beautiful Soup 解析 HTML 文档 的 时 候 ， 解 析 后 的 节点 对 象 有 四 种 ， 它 们 分 
别 为 ( ).( )、 ( a )。 


2. 选择 题 

(1) 在 高 级 语言 中 ， 对 文件 操作 的 一 般 步 又 是 (  )。 
A. 操作 -修改 -关闭 B. 读 写 - 打 开 - 关 闭 
C. 打开 -操作 -关闭 D. 读 - 写 - 关 闭 

(2) 下 列 程序 的 输出 结果 是 ( ): 
import os 


f = openl(r'D:\test.txt','w+') 
f.write('Python') 

f.seek(0) 

m= f.read(3) 

print (m) 

f.close() 


A. Pyt B. Python C.yth D.Py 
(3) 对 Excel 操作 的 说 法 ， 错 误 的 是 ( 。 ). 

A. xlrd 库 提 供 读 取 Excel 文件 的 方法 

B. xlwt 库 提 供 写 Excel 文件 的 方法 

C. xlutils 库 用 于 修改 Excel 文件 

D. 写 Excel 文件 可 以 用 writer 方法 
(4) 以 下 程序 的 正确 输出 是 (  )。 
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EE 
X=4/10 
except ZeroDivisionError: 
print('4') 
A.0 B.4 C.04 防空 
3. 问答 题 


(1) 简单 解释 一 下 文本 文件 和 二 进 制 文件 的 区 别 。 

(2) 简单 分 析 本 章 介绍 的 三 种 解析 XML 方式 的 区 别 。 

(3) 异常 和 错误 有 何 区 别 ? 

(4) try-except 和 try-finally 有 何 区 别 ? 

(5) 使 用 pdb 模块 进行 Python 程序 调试 主要 有 哪 几 种 用 法 ? 


4. 实践 操作 题 


(1) 假设 在 DD 盘 下 有 一 个 名 为 some.txt 的 文件 。 

@@ 写 入 文本 “This is my first Python program” 。 

@ 读 取 文本 的 5 个 字 节 。 

@ 将 文本 文件 移动 到 C 盘 下 ， 并 验证 是 否 移动 成 功 (当前 盘 为 C)。 
(2) 获取 当前 工作 空间 目录 ， 并 获取 当前 目录 下 的 所 有 内 容 。 

(3) 在 Excel 中 创建 csv 文 件 ， 命 名 为 sec.csv。 

GD 编程 将 下 面 三 行 数据 写 入 文件 sec.csv。 


8 和 
和 4 5 6 
CE 


@@ 读 取 该 文件 内 容 。 

(4) 将 输入 的 字符 串 写 入 text.txt 文 件 中 ， 直 到 输入 巨 结 束 ， 如 果 输 入 CtrltZ， 则 终止 
程序 运行 。 注 意 要 保证 打开 的 文件 能 正常 关闭 。 

(5) 将 math.sqrtO 进 行 改进 。 虽 然 math 模块 包含 大 量 的 用 于 处 理 数值 运算 的 函数 和 常 
量 ， 但 是 ， 它 不 能 识别 复数 ， 所 以 创建 了 cmath 模块 来 支持 复数 相关 运算 。 请 创建 一 个 
safe sqrtO 函 数 ， 它 封装 math.sqrt() 并 能 对 负数 进行 开 方 运算 (返回 一 个 对 应 的 复数 )。 
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面向 对 象 编程 


Wl mm Python 程序 设计 实用 教程 


本 章 要 点 


(1) 
(2) 
G3) 
(4) 
(5) 
(0) 
(7) 


面向 对 象 技术 简介 。 

类 与 对 象 的 定义 和 使 用 。 

类 的 属性 与 方法 。 

类 的 作用 域 与 命名 空间 。 

类 的 单 继承 和 多 继承 。 

特定 函数 介绍 。 

面向 对 象 程序 设计 应 用 举例 。 


学 习 目 标 


(1) 
2) 
G3) 
(4) 
(5) 


通过 OOP 进一步 掌握 模块 化 编程 的 程序 设计 风格 。 
理解 在 编写 代码 的 过 程 中 如 何 隐 藏 程序 实现 的 细节 。 
学 会 将 数据 与 其 上 的 操作 分 离 。 

理解 抽象 程序 设计 风格 。 

掌握 运用 面向 对 象 技术 解决 实际 问题 的 方法 。 


本 章 我 们 将 详细 介绍 Python 的 面向 对 象 编程 (Object-Oriented Programming，OOP)。 

Python 从 设计 之 初 就 已 经 是 一 门面 向 对 象 的 语言 了 ， 正 因为 如 此 ， 在 Python 中 创建 一 
个 类 和 对 象 是 很 容易 的 。 随 着 软件 项 目 规模 的 扩大 和 复杂 度 的 增加 ， 参 与 项 目的 开发 人 员 
越 来 越 多 ， 同 时 ， 整 个 程序 的 关联 性 和 依赖 性 呈 指 数 级 增加 。 一 个 程序 员 在 代码 某 处 所 做 
的 微小 改变 ， 可 能 会 使 整个 项 目的 开发 都 因此 而 做 出 较 大 的 调整 ， 解 决 这 些 问 题 的 重要 方 
法 就 是 面向 对 象 技术 。 

如 果 读 者 以 前 没有 接触 过 面向 对 象 的 编程 语言 ， 那 可 能 需要 先 了 解 面向 对 象 语言 的 一 
些 基 本 特征 ， 在 头脑 里 形成 一 个 基本 的 面向 对 象 的 概念 ， 这 样 有 助 于 更 容易 地 学 习 Python 
面向 对 象 编程 。 接 下 来 ， 我 们 先 来 简单 地 了 解 一 下 面向 对 象 的 一 些 基本 概念 和 特征 。 





类 (class): 用 来 描述 具有 相同 属性 和 方法 的 对 象 的 集合 ， 它 定义 该 集合 中 每 个 对 
象 所 共有 的 属性 和 方法 ， 对 象 是 类 的 实例 。 

类 变量 : 类 变量 在 整个 实例 化 的 对 象 中 是 公用 的 ， 类 变量 定义 在 类 中 且 在 函数 体 
之 外 ， 类 变量 通常 不 作为 实例 变量 使 用 。 

数据 成 员 : 类 变量 或 者 实例 变量 用 于 处 理 类 及 其 实例 对 象 的 相关 数据 。 

方法 重 写 : 如 果 从 父 类 继承 的 方法 不 能 满足 子 类 的 需求 ， 可 以 对 其 进行 改写 ， 这 
个 过 程 叫 作 方法 的 重 写 (override)， 也 称 为 方法 的 覆盖 。 

实例 变量 : 定义 在 方法 中 的 变量 ， 只 作用 于 当前 实例 的 类 。 

继承 : 即 一 个 派生 类 (derived class) 继 承 基 类 (base class) 的 数据 成 员 和 方法 ， 继 承 
也 允许 把 一 个 派生 类 的 对 象 作为 一 个 基 类 对 象 对 待 。 例 如 ， 有 这 样 一 个 设计 : 一 
个 Dog 类 型 的 对 象 派生 自 Animal 类 ， 这 是 模拟 “是 一 个 (is-a)” 关 系 (Dog 是 一 种 
Animal); 

实例 化 : 创建 一 个 类 的 实例 ， 即 类 的 具体 对 象 。 

方法 : 类 中 定义 的 函数 。 
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@ ”对 象 : 对 象 包括 两 类 数据 成 员 (类 变量 和 实例 变量 ) 和 方法 ， 通 过 类 定义 的 数据 结 
构 进行 实例 化 。 

与 其 他 编程 语言 相 比 ，Python 在 尽 可 能 不 增加 新 的 语法 和 语义 的 情况 下 加 入 了 类 机 
制 。Python 中 的 类 提供 面向 对 象 编程 的 所 有 基本 功能 : 类 的 继承 机 制 允 许 继承 多 个 基 类 ， 
派生 类 可 以 覆盖 基 类 中 的 任何 方法 ， 方 法 中 可 以 调用 基 类 中 的 同名 方法 ， 对 象 可 以 包含 任 
意 数量 和 类 型 的 数据 。 与 其 他 语言 不 同 的 是 ， 在 Python 中 ， 一 切 皆 为 对 象 ， 只 是 类 型 有 所 
不 同 ， 例 如 ，“hello Python!" 是 一 个 字符 串 (st 类 型 的 对 象 ，[1.2.3] 是 一 个 列表 (lisb 类 型 的 
对 象 ， 而 12 是 一 个 整 型 (int) 的 对 象 。 


6.1 类 的 定义 与 使 用 


Python 中 的 类 是 一 个 抽象 的 概念 ， 甚 至 比 函数 还 要 抽象 。 我 们 可 以 把 它 简单 地 看 作 是 
数据 以 及 由 存 取 、 操 作 这 些 数据 的 方法 所 组 成 的 一 个 集合 。 类 是 Python 的 核心 概念 ， 是 面 
向 对 象 编程 的 基础 。 在 前 面 的 章节 里 我 们 学 习 了 函数 的 用 法 ， 讲 解 了 如 何 重 用 代码 ， 那 为 
什么 还 要 用 类 来 取代 函数 呢 ? 
因为 类 有 如 下 优点 。 

@ 类 对 象 是 多 态 的 : 也 就 是 具有 多 种 形态 ， 这 意味 着 我 们 可 以 对 不 同 的 类 对 象 使 用 
同样 的 操作 方法 ， 而 不 需要 额外 编写 代码 。 
@ 类 的 封装 : 类 封装 之 后 ， 可 以 直接 调用 类 的 对 象 来 操作 内 部 的 一 些 类 方法 ， 不 需 

要 让 使 用 者 看 到 代码 工作 的 细节 。 

@ 类 的 继承 :类 可 以 从 其 他 类 或 者 基 类 中 继承 它们 的 方法 ， 直 接 使 用 。 


6.1.1 类 的 定义 


类 是 对 现实 世界 中 一 些 事物 的 封装 ， 所 有 类 的 开头 都 要 包括 关键 字 class， 紧 接着 的 是 
类 名 和 冒号 ， 随 后 是 定义 类 的 类 体 代码 。 类 定义 的 语法 格式 如 下 : 


class ClassName: 
"ndocumentation string""" 
<statement 1> 
<statement 2> 











<statement-N> 


object 是 “所 有 类 之 父 ”。 如 果 你 的 类 没有 继承 任何 其 他 父 类 ，object 将 作为 默认 的 父 
类 ， 它 位 于 所 有 类 继承 结构 的 最 上 层 (继承 的 概念 在 本 章 稍 后 介绍 )。 定 义 一 个 类 可 以 采用 
下 面 的 方式 。 

【 例 6-1】 类 的 定义 : 

class people: 


# 定 义 基本 属性 


Nam 














age ="0 


# 定 义 私有 属性 ， 私 有 属性 在 类 外 部 无 法 直接 进行 访问 
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weight = 0 
# 定 义 构造 方法 
def init (self,n,a,w): 
self.name = n 
self.age = a 
self. weight =w 
# 定 义 类 本 身 的 方法 
def speak(self) : 
print("%s is speaking: I am %d years old." %$(self.name,self.age)) 
# 类 调用 
P = people('Tom',10,30) 
P.speak() 


执行 以 上 代码 ， 输 出 结果 为 : 
Tom is speaking: I am 10 years old. 
>>> 


狂 注意 : 在 上 面 的 例子 中 ，name 和 age 是 类 的 公有 属性 。 ”weight 使 用 两 个 下 划 线 开 
头 ， 表 示 该 属性 被 声明 为 私有 属性 ， 它 不 能 在 类 的 外 部 被 使 用 或 直接 访问 ， 
但 可 以 在 类 内 部 使 用 selfweight 来 调用 。 
【 例 6-2】( 接 上 例 ) 访 问 类 的 属性 : 


print (p.name) 
print(p. weight) 


执行 以 上 代码 ， 输 出 结果 为 : 
Tom 
Traceback (most recent call last): 
File “D:\Python34\examples. py”, line 20, in module> 
print(p._ weight) 
AttributeError: “people”object has no attribute ’ weight” 
> 


出 错 的 原因 在 于 ， 在 类 的 外 部 使 用 了 私有 属性 。 


6.1.2 类 属性 与 方法 


1. 类 的 公有 属性 

public_attrs: 符合 正常 的 变量 命名 规则 ， 开 头 没有 下 划 线 ， 在 类 的 外 部 可 以 直接 进行 
访问 ， 如 上 例 中 的 name、age。 

2. 类 的 私有 属性 

_ private_attrs: 由 两 个 下 划 线 开头 ， 声 明 该 属性 为 和 有 ， 不 能 在 类 的 外 部 被 使 用 或 直 
接 访问 。 在 类 内 部 的 方法 中 使 用 时 的 格式 为 self._private_attrs。 

【 例 6-3】 访 问 类 的 私有 属性 : 


class Counter: 
privateCount = 1 # 私 有 属性 
publicCount = 1 # 公 有 属性 
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def count (self): 
self. privateCount += 1 
self.publicCount += 1 
print (self. privateCount) 
counter 1 = Counter () 
counter 1.count () 者 打印 数据 
print (counter 1.publicCount) # 打 印 数据 
print (counter 1. privateCount) # 报 错 ， 实 例 不 能 访问 私有 属性 


执行 以 上 代码 ， 输 出 结果 为 : 
区 


2 
Traceback (most recent call last) : 
File "D:/Python34/aaa 程 序 /ex6-3.py"，1line 12, in <module> 
print (counter 1. _ privateCount) # 报错 ， 实 例 不 能 访问 私有 属性 
AttributeError: 'Counter' object has no _ attribute ' _ privateCount" 
>>> 


出 错 的 原因 与 上 例 一 样 。 

3. 类 的 构造 方法 

_init (0: 叫 作 构造 函数 或 者 构造 方法 ， 它 在 生成 一 个 对 象 时 被 自动 调用 。 在 例 6-1 
中 ，p=people(“Tom’,10,30) 语 句 就 是 调用 _init 0 方法 ， 将 参数 传递 给 selfname、selfage 
和 self. weight。 


4. 类 的 公共 方法 


public_method(); 在 类 的 内 部 ， 使 用 def 关键 字 可 以 为 类 定义 一 个 方法 ， 与 一 般 函 数 
定义 不 同 ， 类 方法 必须 包含 参数 self， 且 为 第 一 个 参数 。self 在 Python 里 不 是 关键 字 ， 它 
代表 当前 对 象 的 地 址 ， 类 似 于 Java 语言 中 的 this。 另 外 ，self 不 一 定 要 写成 self， 例 如 将 
self 写成 this 在 例 6-1 中 也 可 以 正确 运行 ， 但 出 于 Python 的 代码 规范 ， 不 建议 用 其 他 标识 
符 替换 self， 以 免 造 成 理解 错误 。 

5. 类 的 私有 方法 

_ private_ method0: 由 两 个 下 划 线 开头 ， 声 明 该 方法 为 私有 方法 ， 不 能 在 类 的 外 部 调 
用 。 在 类 的 内 部 调用 时 格式 为 self._private_methods()。 

【 例 6-4】 类 的 私有 方法 : 

class Site: 

def init (self, name, url): 

self.name = name # 公 有 属性 
self. url = url  # 私 有 属性 
def printme (self) : 


print('name : ', self.name) 
brintt url 2 "Self: Ori) 


def printme 1(self) : # 私 有 方法 
print (' 输 出 私有 方法 ') 

def printme 1(self): # 公 共 方 法 
print (' 输 出 公共 方法 ') 


self. printme 1() 
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wz = Site(' 百 度 网 址 '，'www.baidu.com') 

wz.printme () # 打 印 数据 

wz.printme 1() # 打 印 数 据 ， 调 用 公共 方法 printme 1 () 
wz._ printme 1() # 报 错 ， 实 例 不 能 访问 私有 方法 


执行 以 上 代码 ， 输 出 结果 为 : 

name : 百度 网 址 

url : www.baidu.com 

输出 公共 方法 

输出 私有 方法 

Traceback (most recent call last) : 
File“D:/Python34/aaa 程 序 /hhh. py “，1line 16，in“《moduley> 

Wz. printme_1() # 报错 ， 实例 不 能 访问 私有 方法 


AttributeError: Site”object has no attribute ’” printme 1 








出 错 的 原因 在 于 ， 实 例 不 能 访问 私有 方法 。 


6. 单 下 划 线 (_) 
以 单 下 划 线 开始 的 成 员 变 量 叫 作 保护 变量 ， 意 思 是 只 有 类 对 象 和 子 类 对 象 自己 能 访问 
到 这 些 变量 。 简 单 的 模块 级 私有 化 只 需要 在 属性 名 前 使 用 一 个 单 下 划 线 字符 。 以 单 下 划 线 
开头 (_singlePrivate) 的 属性 代表 不 能 直接 访问 的 类 属性 ， 需 要 通过 类 提供 的 接口 进行 访问 ， 
这 样 做 的 目的 是 防止 模块 的 属性 用 “from mymodule import * ”来 加 载 。 
【 例 6-$】 下 划 线 的 使 用 : 


class Test() : 
def init (self): 
pass 
def public (self): 
print (' 这 是 公共 方法 ') 
def singlePrivate(self): 
print (' 这 是 单 下 划 线 方法 ') 
def doublePrivate(self): 
print (' 这 是 双 下 划 线 方法 ') 
= Pest 
t.public() # 可 以 调用 
七 。 singlePrivate() # 可 以 调用 
t. doublePrivate() # 出 现 错误 


执行 以 上 代码 ， 输 出 结果 为 : 
这 是 公共 方法 
这 是 单 下 划 线 方法 
Traceback (most recent call last): 
File "D:/Python34/aaa 程 序 /ex6-5.py"，1line 14, in <module> 
t._ doublePrivate() # 出 现 错误 
AttributeError: "Test' object has no attribute "aqoublePrivate' 


ee 
3 注意 : f_singlePrivate() 可 以 直接 访问 ， 不 过 根据 Python 的 约定 ， 应 该 将 其 视 作 
private， 而 不 要 在 外 部 使 用 它们 ， 良 好 的 编程 习惯 是 不 要 在 外 部 使 用 它 。 同 
时 ， 根 据 Python docs 的 说 明 ，_object 和 _object 的 作用 域 限制 在 本 模块 内 。 
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表 6-1 所 示 的 是 Python 常用 的 一 些 专 有 方法 。 对 于 其 中 的 _init (构造 函数 )， 前 面 已 
经 介绍 ， 它 在 生成 一 个 对 象 时 被 自动 调用 。 与 此 相反 的 是 _del _( 析 构 函 数 )， 它 在 释放 一 




















个 对 象 时 被 自动 调用 。 


表 6-1 类 的 专 有 方法 














专 有 方法 说 明 
init 构造 函数 ， 在 生成 对 象 时 调用 
_del _ 析 构 函数 ， 释 放 对 象 时 使 用 
Iepr 打印 ， 转 换 
setitem 按照 索引 赋值 
__ getitem 按照 索引 获取 值 
_len_ 获得 长 度 
cmp 比较 运算 
_call 函数 调用 

add __ 加 运算 

sub 减 运 算 
_mul 乘 运算 
_div 除 运算 
_ mod _ 求 余 运算 
_ poW 乘 方 运算 
_str 字符 串 方法 


【 例 6-6】 del 和 repr_ 专 有 方法 的 使 用 : 


Class Pest 
def init (self,name=None): 
self.name = name 
def del (self): 
print ("hello world!") 
def repr (self): 
return "study('Jacky')" 
def say(self) : 
print (self.name) 


Test ("Tim") # 自 动 调用 del 方法 
s= Test ("Tim") 

s.say() 

print (s) # 自 动 调用 ”repr 方法 


EmaltresE REEVON # 先 自动 调用 “repr 方法， 然后 自动 调用 ”del 方法 
执行 以 上 代码 ， 输 出 结果 为 : 
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hello world! 
Tim 
Study( Jacky ) 
Study( Jackyv ) 
hello world! 

D2 


输出 结果 说 明 : 

为 何 程序 输出 的 第 一 行 是 “hello world!” 呢 ? 因为 执行 实例 化 操作 Test(“Tim”) 时 ， 没 
有 把 这 个 实例 赋予 一 个 变量 ， 因 而 这 个 实例 是 没有 用 的 ， 将 由 垃圾 回收 器 自动 回收 ， 当 
然 ， 回 收 之 前 ， 要 释放 对 象 ， 释 放 时 自动 执行 析 构 函数 _del ， 因 而 打印 出 “hello 
world!”。 

第 二 行 的 “Tim” 由 s.say0 输 出 。 执 行 实例 化 操作 Test(“Tim”) 后 会 生成 一 个 实例 ， 把 
该 实例 赋值 给 s 变量 ， 并 调用 该 实例 的 say0 函 数 。 

第 三 行 输出 的 是 “Study(Jacky)”， 这 是 由 print 函数 自动 调用 _repr_ 函 数 输出 的 。 
重 构 _repr 函数 后 ， 不 管 将 对 象 直接 输出 ， 还 是 通过 print 函数 输出 ， 都 按 _repr_ 函 数 
中 定义 的 格式 输出 。 

第 四 行 的 “Study(‘Jacky”))” 和 第 五 行 的 “hello world!” 是 由 print(Test(“Kitty”)) 语 句 输 
出 的 。@ 该 语句 执行 实例 化 操作 Test(“Kitty”) 后 ， 先 执行 print 函数 ， 其 结果 是 调用 
_Iepr 函数 ， 输 出 “Study(‘Jacky’”)”; @@ 因 为 执行 实例 化 Test(“Kitty”) 时 ， 没 有 把 这 个 实 
例 赋予 一 个 变量 ， 所 以 这 个 实例 是 没有 用 的 ， 将 由 垃圾 回收 器 自动 回收 ， 回 收 之 前 先 释 放 
对 象 ， 此 时 自动 执行 析 构 函数 _del 释放 该 对 象 ， 从 而 打印 出 “hello world! ”。 

【 例 6-7】_str_ 专 有 方法 的 使 用 : 

class Test> 

def init (self,number): 

self.a=number[0:3] 
self.b=number[3:6] 

def Str ‘(self}s 

return "%s %s"%(self.a,self.b) 

def test(): 

num=Test (input ("请 输入 数字 : \n")) 

print ("输入 的 数字 是 :", num) 

# 执 行 脚本 

test () 

执行 以 上 代码 ， 输 出 结果 为 : 

请 输入 数字 : 

123456 

输入 的 数字 是 : 123 456 


> 
当 执 行 test0 函 数 时 ，print0 会 自动 调用 _str_ 函数， 从 而 输出 “123 456”( 中 间 带 有 
空格 )， 说 明 print0 函 数 按 我 们 在 str 函数 中 定义 的 格式 进行 了 输出 。 


6.1.3 ”关于 Python 的 作用 域 和 命名 空间 


类 的 定义 非常 巧妙 地 运用 了 命名 空间 ， 要 完全 理解 接 下 来 的 知识 ， 需 要 先 理解 作用 域 
和 命名 空间 的 工作 原理 。 另 外 ， 这 些 知识 对 于 任何 高 级 Python 程序 员 都 非常 有 用 。 
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1. 作用 域 与 命名 空间 的 解释 


在 4.2.6 小 节 中 ， 曾 围绕 着 变量 讨论 了 作用 域 与 命名 空间 ， 本 节 对 此 进一步 讨论 。 

作用 域 是 指 Python 程序 可 以 直接 访问 到 的 命名 空间 。“ 直 接 访 问 ” 在 这 里 意味 着 访问 
命名 空间 中 的 命名 时 无 需 加 入 附加 的 修饰 符 。 

命名 空间 本 质 上 是 一 个 字典 ， 它 的 键 就 是 变量 名 ， 它 的 值 就 是 那些 变量 的 值 。Python 
使 用 命名 空间 来 记录 变量 的 轨迹 。 

在 Python 程序 中 的 任何 一 个 地 方 ， 都 存在 三 个 可 用 的 命名 空间 。 

(1) 每 个 函数 都 有 自己 的 命名 空间 ( 称 作 局 部 命名 空间 )， 它 记录 了 函数 中 的 变量 ， 包 
括 函 数 的 参数 和 定义 的 局 部 变量 。 

(2) 每 个 模块 都 有 自己 的 命名 空间 ( 称 作 全 局 命名 空间 )， 它 记录 了 模块 中 的 变量 ， 包 
括 函 数 、 类 、 其 他 导入 的 模块 、 模 块 级 的 变量 和 常量 。 

(3) 每 个 模块 都 有 可 访问 的 内 置 命名 空间 ， 它 存放 着 内 建 函 数 和 异常 。 

如 果 一 个 命名 声明 为 全 局 的 ， 那 么 所 有 的 赋值 和 引用 都 直接 针对 包含 模块 全 局 命名 的 
中 级 作用 域 。 另外， 从 外 部 访问 到 的 所 有 内 层 作 用 域 的 变量 都 是 只 读 的 。 

从 文本 意义 上 讲 ， 局 部 作用 域 引 用 当前 函数 的 命名 空间 。 在 函数 之 外 ， 局 部 作用 域 与 
全 局 作用 域 引用 同一 命名 空间 一 一 模块 命名 空间 。 而 类 定义 也 是 局 部 作用 域 中 的 一 个 命名 
空间 。 

作用 域 决定 于 源 程 序 的 文本 : 一 个 定义 于 某 模块 中 的 函数 的 全 局 作用 域 是 该 模块 的 命 
名 空间 ， 而 不 是 该 函数 的 别名 被 定义 或 调用 的 位 置 ， 了 解 这 一 点 非常 重要 。 另 一 方面 ， 命 
名 的 实际 搜索 过 程 是 动态 的 ， 是 在 运行 时 确定 的 。 然 而 ，Python 语言 也 在 不 断 发 展 ， 以 后 
有 可 能 会 成 为 静态 的 (编译 时 确定 )， 那 时 就 不 依赖 于 动态 解析 。 


2. 命名 空间 的 查找 顺序 


当 一 行 代码 要 使 用 变量 x 的 值 时 ，Python 会 到 所 有 可 用 的 命名 空间 去 查找 变量 ， 其 查 
找 顺序 如 下 。 

(1) 局 部 命名 空间 特 指 当前 函数 或 类 的 方法 。 如 果 函 数 中 定义 了 一 个 局 部 变量 
x，Python 将 使 用 这 个 变量 ， 然 后 停止 搜索 。 

(2) 全 局 命名 空间 特 指 当前 的 模块 。 如 果 模 块 中 定义 了 一 个 名 为 x 的 变量 、 函 数 
或 类 ，Python 将 使 用 它 ， 然 后 停止 搜索 。 

(3) 内 置 命名 空间 对 每 个 模块 都 是 全 局 的 ， 作 为 最 后 的 尝试 ，Python 将 假设 x 是 
内 建 函 数 或 变量 。 

(4) 如 果 Python 在 这 些 命名 空间 中 都 找 不 到 x， 它 将 放弃 查找 并 引发 一 个 NameError 
异常 ， 同 时 传递 There is no variable named x’ 这样 一 条 信息 。 

不 同 的 命名 空间 在 不 同 的 时 刻 创建 ， 有 不 同 的 生存 期 。 包 含 内 建 函 数 的 命名 空间 在 
Python 解释 器 启动 时 创建 ， 会 一 直 保 留 ， 不 被 删除 。 模 块 的 全 局 命名 空间 在 模块 定义 被 读 
入 时 创建 ， 通 常 ， 模 块 命名 空间 也 会 一 直 保存 到 解释 器 退出 。 由 解释 器 在 最 高 层 调 用 执行 
的 语句 ， 不 管 它 是 从 脚本 文件 中 读 入 还 是 来 自 交 互 式 输 入 ， 都 是 _main “模块 的 一 部 分 ， 
所 以 它们 也 拥有 自己 的 命名 空间 。 内 置 命 名 也 同样 被 包含 在 一 个 模块 中 ， 它 被 称 作 
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_builtin ， 该 模块 包含 内 建 函 数 、 异 常 以 及 其 他 属性 。 当 函数 被 调用 时 ， 创 建 一 个 局 部 
命名 空间 ， 我 们 可 以 通过 globals0 和 locals0) 两 个 内 建 函 数 判 断 某 一 名 字 属 于 哪个 名 称 空 
间 ，locals0 是 只 读 的 ，globals0 不 是 。 

【 例 6-8】locals0 〇 函数 示例 : 


def foo (arg，al) : 
> 
Y= "abc" 
for i in range(5): 
3 
k=i 
print (locals()) 
# 调 用 函数 的 打印 结果 
foo (2, 3) 


执行 以 上 代码 ， 输 出 结果 为 : 


Ue WE hr te | A tee Uh 
>>> 


locals() 实 际 上 没有 返回 局 部 命名 空间 ， 它 返回 的 是 局 部 命名 空间 的 一 个 拷贝 ， 所 以 对 
它 进行 改变 时 ， 对 局 部 命名 空间 中 的 变量 值 并 无 影响 。 

【 例 6-9】globals0 函 数 示 例 ; 

print ("当前 的 全 局 命名 空间 :") 

var=globals () 

print (var) 


执行 以 上 代码 ， 输 出 结果 为 : 











当前 的 全 局 命名 空间 : 

{' loader ': <class ' frozen importlib.BuiltinImporter'>，'Var': {...}, ' 
package ': None, ' spec ': None, ' file ': 'D:/Python34/aaa 程 序 /ex6-9.py"' 
+ " doc ': None, ' name !: ' main ', ' builtins ': <module 'builtins' 





(built-in)>} 
>>> 


globals0 函 数 返 回 实际 的 全 局 命名 空间 ， 而 不 是 它 的 一 个 拷贝 。 所 以 对 globals0 函 数 所 
返回 的 var 的 任何 改动 都 会 直接 影响 到 全 局 变量 。 


3. 庶 套 函数 命名 空间 的 查找 步骤 


(1) 先 在 当前 函数 ( 嵌 套 的 函数 或 lambda 匿名 函数 ) 的 命名 空间 中 搜索 。 
(2) 然后 在 父 函数 的 命名 空间 中 搜索 。 
(3) 接着 在 模块 命名 空间 中 搜索 。 
(4) 最 后 在 内 建 函 数 的 命名 空间 中 搜索 。 
下 面 举例 说 明 。 
【 例 6-10】 嵌 套 函 数 命 名 空间 示例 : 
address = ”地址 : " 
def func country (country) : 

def func Part (Part) : 

city= "天 津 = # 覆 盖 父 函数 的 part 变量 


print (address + country + city + part) 


五 
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ity # 初 始 化 city 变量 

# 调 用 内 部 函数 

func part (" 西 青 ") # 初 始 化 part 变量 
# 调 用 外 部 函数 


func_country(" 中 国 ") # 初 始 化 country 变量 


执行 以 上 代码 ， 输 出 结果 为 : 
地 址 : 中 国 天 津 西 青 
>>> 


以 上 例子 中 ，address 在 全 局 命名 空间 中 ，country 在 父 函 数 的 命名 空间 中 ，city 和 part 
在 子 函数 的 命名 空间 中 。 





6.2 ”Python 类 与 对 象 


6.2.1 类 对 象 


类 对 象 支持 两 种 操作 : 属性 引用 和 实例 化 。 
类 对 象 的 属性 引用 与 Python 中 所 有 属性 的 引用 一 样 ， 都 使 用 标准 的 语法 : obj.name。 
类 对 象 创建 之 后 ， 类 命名 空间 中 所 有 的 命名 都 是 有 效 属性 名 。 在 Python 中 ， 方 法 定义 在 类 
的 定义 ( 即 声明 ) 中 ， 但 只 能 被 类 对 象 的 实例 所 调用 。 调 用 一 个 方法 的 途径 分 三 步 。 
(1) 定义 类 和 类 中 的 方法 。 
(2) 创建 一 个 或 若干 个 实例 ， 即 将 类 实例 化 。 
(3) 用 所 创建 的 实例 调用 方法 。 
【 例 6-11】 类 的 定义 与 实例 化 : 
class MyClass: 
mm" 一 个 简单 的 类 实例 """ 
i= 12 
def f(self): 
return 'hello world' 
# 实 例 化 类 
MyClassl = MyClass() 
# 访 问 类 的 属性 和 方法 
print ("MyClass 类 的 属性 i 为 : "，MyClass1.i) 
print ("MyClass 类 的 方法 £ 输出 为 : "，Myclassl.f()) 


执行 以 上 代码 ， 输 出 结果 为 : 
MyClass 类 的 属性 i 为 : 12 
MyClass 类 的 方法 £ 输出 为 : hello world 


>> 


本 例 中 ，MyClass1.i 和 MyClassl.f0 都 是 有 效 的 属性 引用 ， 分 别 返回 一 个 整数 和 一 个 方 
法 对 象 。 也 可 以 对 类 属性 赋值 ， 即 可 以 通过 给 MyClassl.i 赋值 来 修改 它 。 如 : 


MyC1lassl.i=56 
print ("修改 后 Myclass 类 的 属性 i 为 : "，MyClass1.i) 


执行 以 上 代码 ， 输 出 结果 为 : 
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修改 后 Myclass 类 的 属性 i 为 : 56 


区 
类 的 实例 化 使 用 函数 符号 ， 只 要 将 类 对 象 看 作 是 一 个 返回 新 的 类 实例 的 无 参数 函数 即 
可 。 例 如 (假设 沿用 前 面 的 类 ): 


MyClassl = MYC1lass() 


该 语句 创建 了 一 个 新 的 类 实例 (对 象 )， 并 将 该 对 象 赋 给 局 部 变量 MyClass1。 通 过 实例 
化 操作 (“调用 ”一 个 类 对 象 ) 来 创建 一 个 空 的 对 象 时 ， 通 常会 把 这 个 新 建 的 实例 赋 给 一 个 
变量 。 赋 值 在 语法 上 不 是 必需 的 ， 但 如 果 不 把 这 个 实例 保存 到 一 个 变量 中 ， 它 就 没有 用 ， 
会 被 垃圾 收集 器 自动 回收 ， 因 为 没有 任何 引用 指向 这 个 实例 。 换 言 之 ， 刚 刚 所 做 的 一 切 ， 
仅仅 是 为 那个 实例 分 配 了 一 块 内存 ， 随 即 又 释放 掉 ， 这 样 做 是 没有 任何 意义 的 。 上 一 节 的 
例 6-6 程序 中 第 一 条 执行 语句 Test(“Tim”) 就 是 一 个 很 典型 的 例子 。 

很 多 类 都 倾向 于 创建 一 个 有 初始 化 状态 的 对 象 。 因 此 类 可 能 会 定义 一 个 名 为 _init (0 
的 特殊 方法 ( 称 为 构造 方法 ， 前 面 已 提 到 )， 像 下 面 这 样 : 

def init (self): 

self.data = [] 
当 类 被 调用 时 ， 实 例 化 的 第 一 步 就 是 创建 实例 对 象 ， 一 旦 对 象 创建 ，Python 就 检查 是 
否 已 经 实现 _init_() 方 法 。 默 认 情 况 下 ， 如 果 没有 定义 (或 覆盖 ) 特 殊 方法 _init_0， 对 实 
例 不 会 施加 任何 特别 的 操作 。 任 何 所 需 的 特定 操作 ， 都 需要 程序 员 实现 _init 0 方法 ， 覆 
盖 它 的 默认 行为 。 所 以 在 下 例 中 ， 可 以 这 样 创建 一 个 新 的 实例 : 


MyClass 1 = MyClass() 


当然 ， 出 于 弹性 的 需要 ，_ init_() 方 法 可 以 有 参数 。 事 实 上 ， 通 过 _init 0 方法 参数 
被 传递 到 类 的 实例 上 。 
【 例 6-12】 使 用 带 参数 的 _init_() 方 法 初始 化 : 


class Complex: 
def init (self, realpart, imagpart): 
self.r = realpart 
self.i = imagpart 
X = Complex(2.4, -4.6) 
Print(zs rr Za) 


执行 以 上 代码 ， 输 出 结果 为 : 
| 曼 -4.6 
>>> 








kk 





6.2.2 ”类 的 属性 


有 两 种 有 效 的 属性 名 : 数据 属性 和 特殊 类 属性 。 
1. 数据 属性 


这 相当 于 Smalltalk 中 的 实例 变量 或 C++ 中 的 数据 成 员 。 与 局 部 变量 一 样 ， 数 据 属性 不 
需要 声明 ， 第 一 次 使 用 时 它们 就 会 生成 。 
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【 例 6-13】 类 数据 属性 说 明 : 
class foo (object) : 
三 = 100 
print (foo.f) 
print (foo.f+1) 


执行 以 上 代码 ， 输 出 结果 为 : 





100 
101 
>>> 
2. 特殊 类 属性 
对 任何 类 foo， 其 部 分 特殊 属性 如 表 6-2 所 示 。 
表 6-2 ”特殊 类 属性 
类 属性 类 属性 说 明 
foo. name 类 foo 的 名 字 ( 字 符 串 ) 
foo. doc _ 类 foo 的 文档 字符 串 
foo._ bases 类 foo 的 所 有 父 类 构成 的 元 组 
foo._dict 类 foo 的 属性 
foo. module 类 foo 定义 所 在 的 模块 
foo. class 实例 foo 对 应 的 类 


【 例 6-14】dir0 函 数 和 类 属性 _ dict_ 的 使 用 : 


class MyClass (object): 
'MyClass 类 定义 ' 
myVer = '3.4"' 
def showMyVer (self): 
print (MyClass.myVer) 
print (dir(MyClass)) 
print (MyClass. dict ) 


根据 上 面 定 义 的 类 ， 我 们 使 用 dir0 和 特殊 类 属性 _dict 来 查看 一 下 类 的 属性 。 
执行 以 上 代码 ， 输 出 结果 为 : 

















| :1 + RE :1 + » EN 0 和 
vrvat pn Te qetattribates TO gt Me MV hashe Vo inite We 
le_" "lt ', ' module '，" ne ', '_new ', '_ reduce '，' reduce e 
I Topro "rsetattr “WY sizeof J tr “7 "bclaashook WW 
' weakref ', 'myVer', 'showMyVer'] 

{” module ie * wain *, » dict ™: <attribute * dict " of Myclasa' opj 
ects>, ' weakref ': <attribute '_ weakref ' of 'MyClass' objects>, '_ doc 


_': 'MyClass 类 定义 '，'showMyVer': <function MyClass.showMyVer at 0x02B62150>, 
'™myVer': '3.4'} 
>>> "| 


从 上 面 可 以 看 到 ，dir0) 返 回 的 仅 是 对 象 属性 的 一 个 名 字 列 表 ， 而 _dict_ 返回 的 是 一 个 
字典 ， 它 的 键 是 属性 名 ， 值 是 相应 属性 的 数据 值 。 结 果 还 显示 MyClass 类 中 两 个 熟悉 的 属 
性 showMyVer 和 myVer， 以 及 一 些 新 的 属性 。 
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@ _dict 属性 包含 一 个 字典 ， 由 类 的 数据 属性 组 成 。 访 问 一 个 类 属性 的 时 候 ， 
Python 解释 器 将 会 搜索 字典 以 得 到 需要 的 属性 。 如 果 在 _dict_ 中 没有 找到 ， 将 
会 在 基 类 的 字典 中 进行 搜索 ， 采 用 “深度 优先 搜索 ”顺序 。 基 类 集 的 搜索 是 按 顺 
序 的 ， 从 左 到 右 ， 按 其 在 类 定义 时 ， 定 义 父 类 参数 的 顺序 。 对 类 的 修改 仅 会 影响 
到 此 类 的 字典 ， 基 类 的 _dict ”属性 不 会 被 改动 。 

@ _name 是 给 定 类 的 字符 名 字 。 它 适用 于 那 种 只 需要 字符 串 ( 类 对 象 的 名 字 )， 而 
非 类 对 象 本 身 的 情况 。 
print (MyClass. name ) 
输出 : MyClass 

@ _doc 是 类 的 文档 字符 串 ， 与 函数 及 模块 的 文档 字符 串 相 似 ， 必 须 紧 随 头 行 
(header line)。 文 档 字符 串 不 能 被 派生 类 继承 ， 也 就 是 说 ， 派 生 类 必须 含有 它们 自 
己 的 文档 字符 串 。 
print (MyClass. doc ) 
输出 : Myclass 类 定义 

@ _module 的 引入 是 为 了 更 清晰 地 对 类 进行 描述 ， 这 样 类 名 就 完全 由 模块 名 所 限 
定 了 。 


print (MyClass. module ) 


输出 : _ main 














6.2.3 ”实例 属性 


foo 1. class 


内 建 函数 dir0 可 以 显示 类 属性 ， 同 样 还 可 以 打印 所 有 的 实例 属性 。 
【 例 6-1S】 实 例 属性 说 明 : 
class foo (object) : 
pass 
foo 1 = foo() 
print (dir(foo 1)) 


执行 以 上 代码 ， 输 出 结果 为 : 














人 
rmt ytatteib to Te wT A 和 炊 让 
a ,< 
KR Vopr "yy " Sotattr Vy © Bizeof Y !' str 'y' Subclasshooks 
' weakref ] 

>>> 


实例 有 两 个 特殊 属性 ， 如 表 6-3 所 示 。 
表 6-3 ”特殊 实例 属性 


实例 属性 
实例 化 foo_1 的 类 





foo 1. dict 


.Te 





foo_1 的 属性 











现在 使 用 类 foo 及 其 实例 foo_1 来 看 看 这 些 特殊 实例 属性 。 
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【 例 6-16】 查 看 实例 属性 _dict 和 class : 


class foo (object) : 
pass 

foo 1 = foo() 

prine (E00 16° dLet 

Piliney (foo lelasse) 


执行 以 上 代码 ， 输 出 结果 为 : 
{} 


<class ' main .foo'> 
>>> 


foo_1 现在 还 没有 数据 属性 ， 但 我 们 可 以 添加 一 些 ， 再 来 检查 _dict_ 属 性 。 
【 例 6-17】 查 看 类 的 数据 属性 : 
class foo (object) : 
pass 
foo 1 = foo() 
foo 1.£f = 100 
E00 1b = "hello® 
Print Vfoo LT. ‘dict 
print (foo 1. class ) 


执行 以 上 代码 ， 输 出 结果 为 : 
tb “hellor "ft LO0) 
<elass lt gain -Fo0> 
这 


壮 注意 : _dict 属性 由 一 个 字典 组 成 ， 包 含 一 个 实例 的 所 有 属性 。 键 是 属性 名 ， 值 是 
属性 相应 的 数据 值 。 字典 中 仅 有 实例 属性 ， 没 有 类 属性 或 特殊 属性 。 


6.2.4 一些 说 明 


同名 的 数据 属性 会 覆盖 方法 属性 ， 最 好 以 某 种 命名 约定 来 避免 冲突 ， 因 为 这 在 大 型 程 
序 中 可 能 会 导致 出 现 难以 发 现 的 bug。 可 选 的 约定 包括 : 

@ ”类 名 用 大 写字 母 书写 。 

@ 方法 的 首 字母 大 写 。 

@ 数据 属性 名 前 绥 小 写 (可 能 只 是 一 个 下 划 线 )。 

@ 方法 使 用 动词 而 数据 属性 使 用 名 词 。 

数据 属性 可 以 由 方法 引用 ， 也 可 以 由 普通 用 户 调用 。 换 名 话说， 类 不 能 实现 纯 的 数据 
类 型 。 事 实 上 ，Python 中 没有 什么 办 法 可 以 强制 隐藏 数据 ， 一 切 都 基于 约定 的 惯例 。 

Python 程序 员 应 该 小 心 使 用 数据 属性 ， 因 为 随意 修改 数据 属性 可 能 会 破坏 本 来 由 方法 
维护 的 数据 一 致 性 。 需 要 注意 的 是 ， 程 序 员 只 要 注意 避免 命名 冲突 ， 就 可 以 随意 向 实例 中 
添加 数据 属性 而 不 会 影响 方法 的 有 效 性 。 再 次 强调 ， 命 名 约定 可 以 省 去 很 多 麻烦 ， 如 果 不 
遵守 这 个 约定 ， 其 他 的 Python 程序 员 阅读 你 的 代码 时 会 感到 不 便 。 

从 方法 内 部 引用 数据 属性 以 及 其 他 方法 没有 什么 快捷 的 方式 。 这 事实 上 增加 了 方法 的 
可 读 性 : 即使 粗略 地 浏览 一 个 方法 ， 也 不 会 有 混淆 局 部 变量 和 实例 变量 的 机 会 。 如 前 所 
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述 ,方法 的 第 一 个 参数 命名 为 self， 这 仅仅 是 一 个 约定 ， 对 Python 而 言 ，self 绝对 没有 任 
何 特殊 含义 。 通 过 使 用 self 参数 的 方法 属性 ， 方 法 可 以 调用 其 他 的 方法 。 
【 例 6-18】self 参数 的 使 用 : 


class Bag: 
def init (self): 
self.data = [] 
def addl(self, zx): 
self.data.append (x) 
print (self.data) 
def adqtwice (self, x): 
self.add (x) 
print (self.data) 
bag 1 = Bag() 
bag 1.add(5) 
bag 1.addtwice(6) 


执行 以 上 代码 ， 输 出 结果 为 : 











[5] 
Weal 
[本 可 
>>> 
6.3 继承 
6.3.1 单 继 承 


Python 同样 支持 类 的 继承 。 如 果 一 种 语言 不 支持 继承 ， 类 就 没有 什么 意义 。 类 还 允许 
派生 ， 即 用 户 可 以 创建 一 个 子 类 (又 称 派生 类 )， 它 也 是 类 ， 而 且 继 承 父 类 ( 即 基 类 ) 的 所 有 特 
征 和 属性 。 

创建 派生 类 的 语法 格式 为 : 

class DerivedClassName (BaseClassName): 

<statement-1> 
eet 

基 类 名 BaseClassName 必须 与 派生 类 定义 在 一 个 作用 域内 。 除 了 用 类 名 ， 还 可 以 用 表 
达 式 。 基 类 可 以 定义 在 另 一 个 模块 中 ， 这 一 点 非常 有 用 ， 语 法 格式 如 下 : 

class DerivedclassName (modname .BaseClassName): 

<statement-1> 
atatenent n> 

【 例 6-19】 单 继承 举例 : 

坦 类 定义 


class people: 


# 定 义 基本 属性 
(ma. 


第 6 章 面 身 对 象 编程 又 


name = ”" 
age=0 
# 定 义 私有 属性 ， 私 有 属性 在 类 外 部 无 法 直接 进行 访问 
weight = 0 
# 定 义 构造 方法 
def init (self,n,a,w): 
Self name =n 
self.age = a 
self. weight = w 
def speak (self): 
print("%s says: I am %d years old" %(self.name,self.age)) 
# 单 继承 
class student (people): 
grade = "'" 
def init (self,n,a,w,g): 
斐 调用 父 类 的 构造 函数 
people. init (self,n,a,w) 
self.grade = 9 
# 重 写 父 类 的 方法 
def speak(self): 
print("%s says: I am %d years old, I am in Grade %d." 
(self.name, self .age, self .grade)) 
s= student('Tom',10,90,3) 
s.speak() 


执行 以 上 代码 ， 输 出 结果 为 : 
Tom says: I am 10 years old, I am in Grade 3. 
>>> 


[二 提示 : 

@@ 派生 类 定义 的 执行 过 程 和 基 类 是 一 样 的 。 构 造 派生 类 对 象 时 就 继承 了 基 类 。 这 在 
解析 属性 引用 的 时 候 尤 其 有 用 : 如 果 在 类 中 找 不 到 请 求 调用 的 属性 ， 就 搜索 基 
类 。 如 果 基 类 是 由 别 的 类 派生 而 来 ， 这 个 规则 会 递归 地 应 用 上 去 。 

@ 派生 类 的 实例 化 没有 什么 特殊 之 处 : DerivedClassName()( 示 列 中 的 派生 类 ) 创 建 一 
个 新 的 类 实例 。 方 法 引用 按 如 下 规则 解析 : 搜索 对 应 的 类 属性 ， 必 要 时 沿 基 类 链 
逐 级 搜索 ， 如 果 找到 函数 对 象 ， 这 个 方法 引用 就 是 合法 的 。 

@ ”派生 类 可 能 会 覆盖 其 基 类 的 方法 。 因 为 方法 调用 同一 个 对 象 中 的 其 他 方法 时 没有 
特权 ， 基 类 的 方法 调用 同一 个 基 类 的 方法 时 ， 可 能 实际 上 最 终 调用 派生 类 中 的 履 
盖 方 法 。 对 于 C++ 程序 员 来 说 ，Python 中 的 所 有 方法 本 质 上 都 是 虚 方 法 。 

@@ ”派生 类 中 的 覆盖 方法 可 能 是 想 要 扩充 而 不 是 简单 替代 基 类 中 的 重 名 方法 。 有 个 简 
单 的 方法 可 直接 调用 基 类 方法 ， 即 BaseClassName.methodname(self, arguments)， 
有 时 这 对 程序 员 也 很 有 用 。 要 注意 的 是 ， 只 有 基 类 在 同一 全 局 作用 域 定 义 或 导入 
时 才能 这 样 用 。 


6.3.2 多 继承 
Python 同样 有 限 地 支持 多 继承 形式 。 多 继承 的 类 定义 语法 格式 如 下 : 


class DerivedClassName (Basel, Base?2, Base3): 
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<Statement-1> 


<Statement-N> 


这 里 唯一 需要 解释 的 语义 是 解析 类 属性 的 规则 。 顺 序 是 深度 优先 ， 从 左 到 右 。 因 此 ， 
如 果 在 DerivedClassName( 示 例 中 的 派生 类 ) 中 没有 找到 某 个 属性 ， 就 会 搜索 Basel1， 然 后 递 
归 地 搜索 其 基 类 ， 如 果 最 终 没有 找到 ， 就 搜索 Base2， 依 此 类 推 。 深 度 优 先 不 区 分 属性 继 
承 自 基 类 还 是 直接 定义 。 

【 例 6-20】 多 继承 举例 : 

# 类 定义 


class people: 
# 定 义 基本 属性 
hame 二 
age =0 
# 定 义 私有 属性 ， 私 有 属性 在 类 外 部 无 法 直接 进行 访问 
weight = 0 
# 定 义 构造 方法 
def init (self,n,a,w): 
Selfename = 
self.age = a 
self. weight = w 
def speak(self): 
print("%s says: I am %d years old" %(self.name,self.age)) 
# 单 继承 示例 
class student (people): 
grade = ' 
def init (self,n,a,w,g): 
# 调 用 父 类 的 构 函 
people. init (self,n,a,w) 
self.grade = 9 
# 补 写 父 类 的 方法 
def speak(self): 
print("%s says: I am %d years old, I am in Grade %d." 
S$(self.name, self.age, self .grade)) 
# 男 一 个 类 ， 多 重 继承 之 前 的 准备 
class speaker(): 
Eopic = 后 
namer= 
def Lnit "(aolEr nt 
Self.name = 
self.topic = 七 
def speak (self): 
print ("I am %s,I am a speaker,my topic 
is $s"$%(self.name, self.topic)) 
# 多 重 继承 
class sample (Speaker, student) : 
ET 
def nalt selfrnarv gt}: 
student. init (self.nrarwrdg) 
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speaker. init (self,n,t) 


test 1 = sample("Tom",12,90,3,"0ne World One Dream") 
test 1.speak() ”#4 方 法 名 相同 ， 默认 调用 的 是 在 括号 中 排 前 的 父 类 的 方法 ， 
# 即 speaker 类 里 面 的 方法 


执行 以 上 代码 ， 输 出 结果 为 : 
I am Tom,I am a speaker,my topic is One World One Dream 
>>> 


千 注意 : 不 加 限制 地 使 用 多 继承 会 带 来 维护 上 的 蛋 梦 ， 因 为 Python 中 只 依靠 约定 来 避 
免 命名 冲突 。 多 继承 的 一 个 很 有 名 的 问题 是 ， 派 生 继 承 的 两 个 基 类 都 是 从 同 
一 个 基 类 继承 而 来 。 目 前 还 不 清楚 这 在 语义 上 有 什么 意义 ， 然 而 ， 这 会 造成 
意 想不到 的 后 果 。 


6.3.3 补充 


上 述 例子 中 展示 了 方法 重 写 的 概念 ， 下 面 再 展示 一 个 简单 的 方法 重 写 的 例子 ， 从 而 强 
调 方法 重 写 的 重要 性 。 
1. 方法 重 写 
如 果 父 类 方法 的 功能 不 能 满足 需求 ， 可 以 在 子 类 里 重 写 父 类 的 方法 。 
【 例 6-211 方法 重 写 : 
class Parent: # 定 义 父 类 
def myMethod (self): 
print (' 调 用 父 类 方法 ') 
class Child(Parent) : # 定 义 子 类 
def myMethod (self): 
print (' 调 用 子 类 方法 ') 
child 1 = Child() # 子 类 实例 
Child 1.myMethod() # 子 类 调用 重 写 方法 
执行 以 上 代码 ， 输 出 结果 为 : 
调用 子 类 方法 


PD 

2. 运算 符 重 载 

运算 符 重 载 是 针对 新 类 型 数据 的 实际 需要 ， 对 原 有 运算 符 进行 适当 的 改造 。 一 般 来 
说 ， 重 载 的 功能 应 当 与 原 有 功能 相 类 似 ， 不 能 改变 原 运 算 符 的 操作 对 象 个 数 ， 同 时 至 少 要 
有 一 个 操作 对 象 是 自 定义 类 型 。 

Python 同样 支持 运算 符 重 载 ， 它 的 运算 符 重 载 就 是 通过 重 写 这 些 Python 内 建 方法 来 实 
现 的。 这 些 内 建 方法 都 是 以 双 下 划 线 开头 和 结尾 的 (类 似 于 _X_ 的 形式 )，Python 通过 这 
种 特殊 的 命名 方式 来 拦截 操作 符 ， 以 实现 重 载 。 当 Python 的 内 置 操 作 运用 于 类 对 象 时 ， 
Python 会 去 搜索 并 调用 对 象 中 指定 的 方法 来 完成 操作 。 运 算 符 重 载 是 通过 创建 运算 符 函 数 
实现 的 ， 运 算 符 重 载 实际 是 一 个 函数 ， 所 以 运算 符 的 重 载 实际 上 是 函数 的 重 载 。 解 释 程序 
对 运算 符 重 载 的 选择 遵循 着 函数 重 载 的 选择 原则 ， 当 遇 到 不 很 明显 的 运算 时 ， 编 译 程序 将 
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去 寻找 参数 相 匹 配 的 运算 符 函数 。 
类 可 以 重 载 加 减 运算 、 打 印 、 函 数 调用 、 索 引 等 内 置 运 算 ， 运 算 符 重 载 使 我 们 的 对 象 
的 行为 与 内 置 对 象 的 行为 一 样 。 
例如 ， 如 果 类 实现 了 _add 方法 ， 当 类 的 对 象 出 现在 “+” 运 算 符 中 时 ， 会 调用 这 个 
方法 ， 如 果 类 实现 了 _sub ”方法 ， 当 类 的 对 象 出 现在 “-” 运 算 符 中 时 ， 会 调用 这 个 方 
法 。 重 载 这 两 个 方法 就 可 以 在 普通 的 类 对 象 上 添加 “+” 或 “-” 运 算 。 
下 面 的 代码 演示 了 如 何 使 用 “+” 和 “-” 运 算 符 。 
【 例 6-22】 运 算 符 重 载 : 
class Computation() : 
def init (self,value): 
self.value = value 
def add (self,other): 
return self.value + other.value 


def sub (self,other): 
return self.value - other.value 








cl Computation (10) 
2 Computation (10) 
print (cl + c2) #“+” 在 作用 于 类 对 象 ， 实 现 加 法 运算 符 的 重 载 
print (cl - c2) #“-” 在 作用 于 类 对 象 ， 实 现 减 法 运算 符 的 重 载 


执行 以 上 代码 ， 输 出 结果 为 : 
20 


0 
>2>> 


站 注意 : 
@ 本 例 通 过 重 载 add 、_sub 两 个 方法 实现 对 加 法 、 减 法 两 个 运算 符 的 重 载 。 
@。 重 载 之 后 ， 运 算 符 的 优先 级 和 结合 性 都 不 会 改变 。 
@ 在 所 有 重 载 方法 的 名 称 前 后 都 有 两 个 下 划 线 ， 以 便 与 同类 中 所 定义 的 变量 名 区 别 
开 来 。 
@ 运算 符 重 载 方法 都 是 可 选 的 ， 如 果 没 有 编写 或 继承 一 个 方法 ， 该 类 直接 不 支持 这 
些 运 算 ， 并 且 试 图 使 用 它们 时 会 引发 一 个 异常 。 类 可 重 载 所 有 的 Python 表达 式 运 
算 符 ， 并 且 使 类 实例 的 行为 像 内 置 类 型 。 
@ 运算 符 重 载 只 是 意味 着 在 类 方法 中 拦截 内 置 的 操作 ， 若 类 的 实例 出 现在 内 置 操作 
中 ， 则 Python 自动 调用 重 载 的 方法 ， 并 且 重 载 方法 的 返回 值 变 成 了 相应 操作 的 结 
果 ， 如 本 例 所 示 。 
3. 空 类 的 使 用 
有 时 候 ， 类 似 于 Pascal 中 “记录 (人 record)” 或 C 中 “结构 体 (struct)” 的 数据 类 型 很 有 
用 ， 因 为 它 可 以 将 一 组 已 命名 的 数据 项 绑 定 在 一 起 。 一 个 空 的 类 定义 可 以 很 好 地 实现 它 ， 
如 下 面 的 例子 。 
【 例 6-23】pass 的 使 用 : 


class Employee: 
pass 
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john = Employee() # 创 建 空 的 类 对 象 
john.name = 'John Doe' 

john.dept = 'computer lab' 
john.salary = 1000 

print (john.name) 

print (john.dept) 

print (john.salary) 


执行 以 上 代码 ， 输 出 结果 为 : 
John Doe 

computer lab 

1000 

>>> 


王 注意 : 某 一 段 Python 代码 如 果 需 要 一 个 特殊 的 抽象 数据 结构 的 话 ， 通 常 可 以 传 入 一 
个 类 ， 事 实 上 ， 这 模仿 了 该 类 的 方法 。 例如， 如 果 有 一 个 用 于 从 文件 对 象 中 
格式 化 数据 的 函数 ， 可 以 定义 一 个 带 有 read0 和 readline() 方 法 的 类 ， 依 次 从 字 
符 串 缓冲 区 读 取 数 据 ， 然 后 将 该 类 的 对 象 作为 参数 传 入 前 述 的 函数 。 

4. if_name =' main ，' 的 作用 

前 已 提 及 ， 这 条 语句 的 意思 是 ， 让 程序 员 写 的 脚本 模块 既 可 以 导入 到 别 的 模块 中 调 

也 可 以 在 该 模块 中 自己 执行 。 

【 例 6-24】 定 义 一 个 模块 ， 名 字 为 ylhtext.py: 


#ylhtext .py 


性 


def main() : 

print ("hello world,I am in %s now." % name ) 
if name ==" main ': 

main() 


执行 以 上 代码 ， 输 出 结果 为 : 
hello world,I am in _main _ now. 
>>> 


在 这 个 文件 中 定义 了 一 个 main0 函 数 ， 如 果 执 行 该 .py 文件 ， 则 if 语句 中 的 内 容 被 执 
行 ， 成 功 调用 main() 函 数 。 现 在 我 们 从 另 一 个 模块 导入 该 模块 ， 这 个 模块 名 字 是 testl.py。 

【 例 6-25】 模块 导入 : 

#testl.py 


from ylhtext import main 
main() 


执行 以 上 代码 ， 输 出 结果 为 : 


hello world,I am in ylhtext now. 





>>> 
了 还 注意 : 过 _name 一 “ main ”下 面 的 main0 函 数 没有 执行 ， 这 样 一 来 ， 既 可 以 让 
模块 文件 独立 运行 ， 也 可 以 被 其 他 模块 导入 ， 而 且 不 会 执行 函数 两 次 。 如 果 
独立 运行 某 个 .py 文件 ， 在 该 文件 中 “_name 一 main ”是 True; 但 


如 果 直 接 从 另外 一 个 .py 文件 通过 import 导入 该 文件 ， 则 此 时 name 的 值 就 
是 这 个 .py 文件 的 名 字 ， 而 不 是 main 。 
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6.3.4 isinstance 函数 


isinstance() 函 数 是 Python 语言 的 一 个 内 建 函 数 。 

语法 : isinstance(object type) 

作用 : 判断 一 个 对 象 或 者 变量 是 否 是 一 个 已 知 的 类 型 。 

(1) 针对 类 来 说 ， 如 果 参 数 object 是 type 类 的 实例 或 者 object 是 type 类 的 子 类 的 一 个 





实例 ， 则 返回 True。 如 果 object 不 是 一 个 给 定 类 型 的 对 象 ， 则 返回 结果 总 是 False。 


【 例 6-26】 使 用 isinstanceO 函 数 判断 一 个 对 象 是 否 是 已 知 的 类 型 ; 


class objA: 


pass 

class objB (objA): 
pass 

A = objA() 

B = objB() 


print (isinstance (A, objA)) 
print (isinstance (B, objA)) 
print (isinstance (A, objB)) 
print (isinstance (B, objB)) 


执行 以 上 代码 ， 输 出 结果 为 : 
True 

True 

False 

TIE 

>>> 


(2) 针对 变量 来 说 ， 其 第 一 个 参数 (object) 为 变量 ， 第 二 个 参数 (type) 为 类 型 名 (如 inb 


或 由 类 型 名 组 成 的 一 个 元 组 (如 (int,list,float))， 其 返回 值 为 布尔 型 (True 或 False)。 若 第 二 个 
参数 为 一 个 元 组 ， 则 变量 类 型 与 元 组 中 的 类 型 名 之 一 相同 时 即 返 回 True。 


【 例 6-27】 使 用 isinstance0) 函 数 判断 变量 a 是 否 是 一 个 已 知 的 类 型 : 


1 

print (isinstance (a,int)) 

print (isinstance (a,str)) 

print (isinstance (a, (str,int,1ist))) 


执行 以 上 代码 ， 输 出 结果 为 : 


True 
False 
True 
>>> 


【 例 6-28】 使 用 isinstanceO) 函 数 判断 字符 串 变 量 是 否 是 一 个 已 知 的 类 型 


Se 
print (isinstance (a,str)) 

print (isinstance (a,int)) 

print (isinstance (a, (int,1ist,float))) 
print (isinstance (a, (int,1ist,float, str))) 


执行 以 上 代码 ， 输 出 结果 为 : 
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True 
False 
False 
True 
> 


6.3.5 super() 函 数 


当 存 在 继承 关系 的 时 候 ， 有 时 候 需 要 在 子 类 中 调用 父 类 的 方法 。 如 果 修 改 父 类 名 称 ， 
那么 在 子 类 中 会 涉及 多 处 修改 。 另 外 ，Python 是 允许 多 继承 的 语言 ， 子 类 调用 的 方法 在 多 
继承 时 就 需要 重复 写 多 次 ， 显 得 累 歼 。 为 了 解决 这 些 问 题 ，Python 引入 了 super0 机 制 ， 语 
法 格式 如 下 : 


super (type[, object-or-type]) 


【 例 6-29】super0 函 数 在 无 参数 类 对 象 中 的 使 用 : 


class Al(object): 
def init (self): 
print ("enter A") 
print ("leave A") 
class BA. : #B 继承 A 
def init (self): 
print ("enter B") 
super(B, self). init () 
print ("leave B") 
b= B() 


执行 以 上 代码 ， 输 出 结果 为 : 
enter B 

enter a 

leave A 

leave B 

>>> 





和 注意 : 在 Python 2 中 ，super() 是 一 定 要 有 参数 的 。Python 2 对 super(B, self). init () 
是 这 样 理解 的 : super(B、self) 首 先 找到 B 的 父 类 (就 是 类 A)， 然 后 把 类 B 的 对 
象 self 转换 为 类 A 的 对 象 ， 然 后 被 转换 的 类 A 对 象 调用 自己 的 _init 函数 。 
Python3.x 可 以 不 加 参数 而 直接 写成 super(). init ()， 并 且 可 以 向 父 类 中 的 属 
性 赋值 。 


【 例 6-30】super0 函 数 在 带 参 数 类 对 象 中 的 使 用 : 


class Foo(object): 
def mlb (sott ar bjs 
el a = 
ael1f.b = 
class Bar (Foo) : 
def init (self, a, c): 
super(). init (a,34) 
self.c= C 
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n= Bar("hello","world") 
print (n.a) 
print (n.b) 
print (n.c) 


执行 以 上 代码 ， 输 出 结果 为 : 


hello 


6.4 ”案例 实 训 : Python 面向 对 象 编程 案例 演练 


本 节 以 几 个 典型 的 案例 展示 Python 面向 对 象 的 编程 思想 。 

1. 栈 

栈 (stack)， 亦 称 堆栈 ， 是 一 种 “先进 后 出 ”或 者 “后 进 先 出 ”的 装载 数据 的 方式 ， 这 
里 的 数据 可 以 是 数字 、 字 母 、 字 符 串 等 。 

进 栈 方式 如 图 6-1 所 示 ， 出 栈 方式 如 图 6-2 所 示 。 


























第 一 次 第 二 次 第 三 次 第 四 次 


图 6-2 四 次 出 栈 pop 操作 说 明 


栈 常 见 的 操作 如 下 。 

stack(0: 建立 一 个 空 的 栈 对 象 ， 调 用 _init_() 方 法 。 

push(): 把 一 个 元 素 添加 到 栈 的 最 项 层 。 

pop0: 删除 栈 最 顶层 的 元 素 ， 并 返回 这 个 元 素 。 

isfull0: 判断 栈 是 否 已 满 ， 栈 满 返 回 True， 不 满 返 回 False。 
isempty(): 判断 栈 是 否 为 空 ， 是 空 返回 True， 不 空 返回 False。 
peek0: 返回 栈 顶 元 素 ， 并 不 删除 它 。 
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这 里 使 用 Python 的 list 对 象 模拟 栈 的 实现 ， 具 体 代码 如 下 : 


class Stack(): 


""" 用 列表 模拟 栈 """ 


def 


init (self,size): 


self.size=size 

self.stack=[] 

self.top=-1 

def push(self,ele) : # 入 栈 之 前 检查 栈 是 否 已 满 
二 下 SEE Ni 


print ("out of range") 
return 


Sse 


self.stack.append (ele) 
self.top+=1 


def pop (self) : # 出 栈 之 前 检查 栈 是 否 为 空 
if self.isempty() : 


Print("stack is empty") 
return 


SLSes 


SelLf.top-=1 
return self.stack.pop() 


def isfull (self): 

return self.top+1==self.size 
def isempty (self): 

return self.top==- 

def peek(self): 

if not self.isempty(): 


return self.stack[len(self.stack)-1] 


s=Stack (20) 

print (s.pop()) 

for i in range(10): 
s.push (i) 


print 
print 
print 
print 
print 
print 
print 


:Pop ()) 
-Pop ()) 
-Pop ()) 
:Pop()) 
.isempty()) 
提醒 四 
-peek() ) 


执行 以 上 代码 ， 输 出 结果 为 : 


stack is empty 


None 
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说 明 如 下 。 
(1) 本 程序 由 两 部 分 组 成 ， 前 半 部 分 是 栈 类 的 定义 与 栈 的 各 种 操作 方法 的 实现 ， 后 半 
部 分 是 类 的 实例 化 与 使 用 。 


(2) 实例 化 后 ， 先 检测 栈 是 否 为 空 ， 若 为 空 ， 则 输出 提示 信息 “stack is empty”， 然 
后 用 for 循环 依次 将 10 个 整数 入 栈 ， 并 对 入 栈 的 数据 进行 操作 。 
外 注意 : 用 列表 来 模拟 栈 ， 并 将 栈 的 方法 封装 在 类 中 ， 在 类 实例 化 后 ， 直 接 用 实例 对 
象 调用 类 中 的 方法 ， 而 不 必 在 意 类 方法 的 实现 细节 ， 同 时 实现 了 数据 与 方法 
的 分 离 。 这 就 是 面向 对 象 的 编程 思想 ， 读 者 从 中 不 难看 出 面向 对 象 编 程 的 本 
质 一 一 隐藏 了 程序 实现 的 细节 ， 实 现 了 静 态 数据 与 动态 功能 的 分 离 。 
2. 队列 
队列 (queue) 是 一 种 “先进 先 出 ”或 者 “后 进 后 出 ”的 装载 数据 方式 ， 这 里 的 数据 可 以 
是 数字 、 字 母 、 字 符 串 等 。 进 队列 方式 如 图 6-3 所 示 ， 出 队列 方式 如 图 6-4 所 示 。 
enqueue> | 4 | 3 | 2 | 1 | 
第 四 次 第 三 次 第 二 次 第 一 次 
6-3 ”四 次 进 队 列 enqueue 操作 说 明 


due>| 4 | 3 | | | 2 1 





图 6-4 ”两 次 出 队列 enqueue 操作 说 明 


队列 常见 的 操作 如 下 。 
queue(): 建立 一 个 空 的 队列 对 象 ， 调 用 _init 0 方法 。 
enqueue(): 把 一 个 元 素 添加 到 当前 队列 元 素 的 最 后 位 置 。 
dequeue(): 删除 队列 最 前 面 的 元 素 ， 并 返回 这 个 元 素 。 
isfull0: 判断 队列 是 否 已 满 ， 队 列 满 返回 True， 不 满 返 回 False。 
isempty0: 判断 队列 是 否 为 空 ， 队 列 为 空 返回 True， 不 空 返回 False。 
这 里 使 用 Python 的 list 对 象 模拟 队列 的 实现 ， 有 具体 代码 如 下 : 
class Queue () : 
""" 用 列表 模拟 队列 """ 
def init (self,size): 
self.size=size 
3elf front== 
ILE rear= 1 
self.queue=[] 
def enqueue (self,ele) : “# 入 队 操作 
ifrself.1sfauLL(hs 
print ("queue is full") 
return 














elsez 
self.queue.append (ele) 
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self.rear+=1 
def dequeue (self): # 出 队 操 作 
if self.isempty() : 
print ("queue is empty") 
return 
人 SS 
self.front+=1 
return self.queue[self.front] 
def isfull (self): 
return self.rear-self.front+1==self.size 
def isempty (self): 
return self.front—self. rear 
q=Queue (15) 
for i in range(10): 
q-.enqueue (i) 
print (gq.dequeue()) 
print (gq.dequeue()) 
print (gq.dequeue()) 
print (gq.dequeue()) 
print (gq.dequeue()) 
print (q.isempty()) 
print (q.isfull()) 


执行 以 上 代码 ， 输 出 结果 为 : 
0 


PONP 


False 
False 
>>> 


说 明 如 下 。 

(1) 本 程序 与 前 一 个 程序 类 似 ， 也 由 两 部 分 组 成 ， 前 半 部 分 是 队列 类 的 定义 与 队列 各 
种 操作 方法 的 实现 ， 后 半 部 分 是 类 的 实例 化 与 使 用 。 

(2) 实例 化 之 后 ， 使 用 for 循环 依次 将 10 个 整数 放 入 队列 ， 并 且 对 队列 中 的 数据 进行 


王 注意 : 
@。 本 程序 也 是 使 用 列表 来 模拟 队列 的 ， 操 作 队列 的 方法 被 封装 在 类 中 ， 在 类 实例 化 
后 ， 直 接 用 实例 对 象 调用 类 中 的 方法 ， 从 而 隐藏 了 程序 实现 的 细节 ， 实 现 了 数据 
与 方法 的 分 离 ， 也 体现 了 抽象 程序 设计 的 风格 。 
@@ 上面 的 两 个 例子 虽然 简单 ， 但 “ 麻 稚 虽 小 ， 五 脏 俱全 ”， 它 们 体现 了 面向 对 象 编 
程 的 思想 ， 展 示 了 面向 对 象 编程 的 优势 。 读 者 在 以 后 的 编程 实践 中 ， 应 尽量 多 地 
使 用 面向 对 象 的 编程 思想 ， 运 用 面向 对 象 技术 来 解决 实际 问题 。 


3. 中 文 分 词 的 最 大 正 向 匹配 算法 
中 文 分 词 一 直 都 是 中 文 自然 语言 处 理 领 域 的 基础 研究 。 中 文 分 词 的 一 个 最 基础 算法 是 
最 大 匹配 算法 (Maximum Matching，MM)。MM 算法 有 两 种 : 最 大 正 向 匹配 和 最 大 逆向 匹 
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配 ， 这 里 介绍 最 大 正 向 匹配 算法 。 这 是 一 种 基于 字典 的 匹配 方法 ， 从 左 向 右 扫 描 ， 寻 找 词 
的 最 大 匹配 。 首 先 规定 一 个 词 的 最 大 长 度 ， 每 次 扫描 时 寻找 当前 开始 的 这 个 长 度 的 词 ， 与 
字典 中 的 词 匹配 ， 如 果 没 找到 ， 就 缩短 长 度 继续 寻找 ， 直 到 找到 或 者 成 为 单字 。 算 法 流程 


如 图 6-5 所 示 。 
开始 


v 

待 切 分 字符 串 S1 
输出 字符 串 S2 
最 大 词 长 MaxLen 


















False 





里 





从 S1 左 边 取出 候选 词 W， 
W<=MaxLen 














S2=S2+W+"/" 
S1=51-W 











不 


























False True 
判断 W 是 否 为 单字 


图 6-5 最 大 正 向 匹配 算法 流程 图 
算法 解释 : 


S1=“ 中 文 分 词 是 汉语 言 处 理 的 基础 "*， 设 定 最 大 词 长 MaxLen 一 5，S2=“。 
字典 中 含有 三 个 词 : [中文 分 词 ]、[ 汉 语言 处 理 ]、[ 基 础 ]。 

(1) S2="“”“; S1 不 为 空 ， 从 S1 左边 取出 候选 子 串 W=“ 中 文 分 词 是 ”。 

中 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 中 文 分 词 ”。 

@” 查 词 表 ，W 在 词 表 中 ， 将 W 加 入 到 S2 中 ，S2=“ 中 文 分 词 / ”"， 并 将 W 从 Sl 中 去 
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掉 ， 此 时 S1=“ 是 汉语 言 处 理 的 基础 ”。 

(2) S1 不 为 室 ， 从 S1 左边 取出 候选 子 串 W=“ 是 汉语 言 处 ”。 

@” 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W= “是 汉语 言 ”。 

@ 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 是 汉语 ”。 

图 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 是 汉 ”。 

@ ” 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 是 ”， 这 时 W 是 单 
字 , 将 WW 加 入 到 S2 中 ，S2=“ 中 文 分 词 / 是 / >， 并 将 W 从 Sl 中 去 掉 ， 此 时 S1=“ 汉 语言 处 
理 的 基础 ”。 

(3) S1 不 为 室 ， 从 S1 左边 取出 候选 子 串 W=“ 汉 语言 处 理 ”。 

查 词 表 ，W 在 词 表 中 ,将 W 加 入 到 S2 中 ，S2=“ 中 文 分 词 / 是 / 汉语 言 处 理 / ”， 并 将 
W 从 Sl 中 去 掉 ， 此 时 S1=“ 的 基础 ”。 

(4) S1 不 为 空 ， 从 S1 左边 取出 候选 子 串 W=“ 的 基础 ”。 

@ ” 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 的 基 ”。 

@ ” 查 词 表 ，W 不 在 词 表 中 ， 将 W 最 右边 一 个 字 去 掉 ， 得 到 W=“ 的 "， 这 时 W 是 单 
字 ,， 将 W 加 入 到 S2 中 ，S2=“ 中 文 分 词 / 是 / 汉语 言 处 理 / 的 /”， 并 将 W 从 S1 中 去 掉 ， 此 
时 S1=“ 基 础 ”。 

(5) S1 不 为 空 ， 从 S1 左边 取出 候选 子 串 W=“ 基 础 ”。 

查 词 表 ，W 在 词 表 中 ， 将 W 加 入 到 S2 中 ，S2=“ 中 文 分 词 / 是 / 汉语 言 处 理 / 的 / ” 基 
础 /”， 并 将 W 从 Sl 中 去 掉 ， 此 时 S1="”。 

(6) S1 为 空 ， 输 出 S2=“ 中 文 分 词 / 是 / 汉语 言 处 理 / 的 / 基础 /作为 分 词 结 果 ， 分 词 
过 程 结束 。 


算法 实现 : 
该 算法 接受 两 个 参数 : 输入 字符 串 和 词典 ， 并 且 自 动 计 算 最 大 词 长 ; 
class FMM: 

""" 最 大 正 向 匹配 算法 类 """ 

size = 0  # 最 大 词 长 

words = [] # 存 放 分 词 结果 的 列表 


index = 0  ## 当 前 的 待 分 词 的 位 置 
def init (self,s,w,i): 
self.size = s 
self.words = w 
self.index = i 


def search maxLen(self,dic): 
nnn 寻找 最 大 词 长 """ 
For i An dics 
if len(i)>self.size: 
self.size=len (i) 
return 


def max match segment (self, chars, dic): 
""" 最 大 正 向 匹配 算法 """ 


while self.index < len(chars) : 


191\, 


mm Python 程序 设计 实用 教程 


matched = False 
for i in range(self.size, 0, -1): 
string = chars[self.index:self.index+i] 
if string in dic: 
self.words.append (string) 
self.words.append ("/") 
matched = True 


break 
if not matched: 
主 志 十 


self.words.append (chars[self.index]) 
self.words.append ("/") 
self.index += i 
print (self.words) 
return 
if name ==" main ": 
dictionary = {" 脚 本 语言 ”， "可以", "一 种 ", "应 用 ", "计算机 ", "领域 ", "很 多 "} 
stringl = "脚本 语言 可 以 应 用 在 计算 机 的 很 多 领域 " 
fmml = FMM(1,[] ,0) 
fmml .search maxLen (dictionary) 
fmml .max match segment (stringl,dictionary) 


执行 以 上 代码 ， 输 出 结果 为 : 

[脚本 语 埋 "，'V1，' 可 以 '"，'V'，' 应 用 "，5V 1，' 在 '，'V'，' 计 算 机 '，'V'，' 的 '， 7 
' 很 多 '，'/'，' 领 域 '，'/'] 

>>> 


算法 分 析 与 评价 : 
该 算法 简单 易 懂 ， 能 解决 70% ~ 80% 的 常用 词 的 分 词 问题 ， 但 性 能 较 差 。 算 法 时 间 复 
杂 度 为 O(nxm)， 其 中 n 为 待 分 词 的 中 文字 符 串 长 度 ， 由 外 层 循环 while 控制 ，m 为 最 大 分 
词 长 度 ， 由 内 层 循环 for 控制 。 最 大 词 长 的 选择 会 影响 每 次 循环 判断 的 次 数 ， 遇 到 长 的 词 
语 ， 如 “中 华人 民 共 和 国 ”， 最 大 词 长 需要 设置 为 7， 但 是 大 多 数 常用 词语 一 般 词 长 为 
2、3 或 4。 当 字典 词 条 数目 过 多 时 ， 会 大 大 增加 每 次 循环 比较 的 次 数 ， 严 重 影响 算法 的 性 
能 。 此 外 ， 该 算法 没有 解决 分 词 的 歧义 问题 。 针 对 该 算法 有 很 多 改进 ， 如 用 正 向 最 大 匹配 
和 逆向 最 大 匹配 相 结合 的 方法 ， 或 者 从 哈 希 散 列 和 前 组 树 等 数据 结构 方向 加 以 改进 。 
4. 类 与 继承 
本 例 定义 了 三 个 类 ， 分 别 为 Member 类 、Student 类 、Teacher 类 ，Student 类 和 
Teacher 类 分 别 继承 Member 类 ， 并 且 定 义 自己 的 tell0 方 法 ， 其 中 使 用 了 Member 类 的 方 
法 。 代 码 如 下 : 
class Member: 
def init (self, name, age): 
self.name = name 
self.age = age 
def tell (self): 
print ('Name:%s,Age:%sd' $$ (self.name, self.age)) 

















class Student (Member): 
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def init (self, name, age, marks): 
Member. init (self, name, age) 
self.marks = marks 

def telll(self): 
Member .tell (self) 
print ('Marks:%d' $ self.marks) 


class Teacher (Member): 
def init (self, name, age, salary): 
Member. init (self, name, age) 
self.salary = salary 
def tell(self): 
Member .tell (self) 
print ('Salary:%d' % self.salary) 


Stu 1 = Student ('Tom', 21, 77) 
Stu 2 = Student ('Tim', 19, 87) 
Stu 3 = Student ('Tam', 22, 93) 
Tea 1 = Teacher('Mrs.Wang', 42, 5200) 


Tea 2 = Teacher('Mr.Zhang', 39, 4800) 
members = [Stu 1,Stu 2,Stu 3,Tea 1,Tea 2] 
for mem in members: 

mem.tell () 


执行 以 上 代码 ， 输 出 结果 为 : 
Name :TomrRAge :21 
Marks:77 
Name:Tim,Age:19 
Marks:87 
Name: Tam, Age:;22 
Marks:93 

Name :Mrs.Wang,Age:42 
Salary:5200 
Name:Mr.Zhang,Age:39 
Salary:4800 

A 


5. 二 元 语法 模型 练习 

(1) 问题 。 

输入 : 

@ 语料库 =“ 把 拆迁 人 民 和 企业 的 生产 安排 好 ， 就 是 生活 和 生产 要 安排 好 。 

20170512-06-008-027/m 企业 msjnt[ 安 排 ] 保 证 [人 民 ].. 安 排 

要 让 企业 有 获得 感 ， 始 终 把 人 民 放 在 心中 最 高 位 置 。 好 人 民 保 证 好 生活 ， 人 民生 活 为 
丙 民 志 

@@ ”测试 句子 = 安排 好 人 民生 活 ” 

输出 : 以 “ 词 ”作为 基 元 计算 出 现 句子 “安排 好 人 民生 活 ” 的 概率 。 

(2) 数学 原理 简 述 。 

对 于 由 W=WiW2...Wn 构 成 的 句子 (其 中 Wi 是 词 或 者 单个 的 字 )， 估 计 P(W) 的 最 直接 的 
方法 是 利用 词 的 n-gram， 即 : 


:(193\. 


Wl oo 区》 Python 程序 设计 实用 教程 


P(W) =P(WW,W,…W,) 
=P(W)P(W, | W)P(W, | WW,)---P(W, | W, WW,) 
但 是 ， 利 用 词 的 n-gram 直接 估计 P(W) 的 方法 ， 在 目前 是 不 可 行 的 ， 所 以 一 般 采 用 马 
尔 可 夫 假设 的 估计 方法 ， 实 现 对 P(W) 的 近似 。 马 尔 可 夫 假 设 任意 一 个 词 W 出 现 的 概率 只 
与 它 前 面 的 词 W_, 有关， 于 是 把 上 面 的 公式 简化 成 : 
P(W) =P(W)P(W, | W)P(W, | W,).. P(W, | W,,) 
这 里 对 应 的 统计 语言 模型 是 二 元 模型 (bigram)， 对 应 一 阶 马尔 科 夫 链 。 如 果 一 个 词 的 
出 现 仅 依赖 于 它 前 面 出 现 的 两 个 词 ， 那 么 就 称 为 三 元 模型 (trigram)， 也 可 以 假设 一 个 词 由 
前 面 a-1 个 词 决定 ， 对 应 的 模型 称 为 n 元 模型 (n-gram)。 
这 里 的 关键 问题 是 估算 条 件 概率 : 
P(W, | W,,) =P(W.,, W)/P(W,,) 
至 此 ， 问 题 转化 为 计算 联合 概率 P(W.,,W) 和 边缘 概率 P(W.,) 。 
而 计算 联合 概率 P(W.,, WW) 和 边缘 概率 PCW ,) 时 ， 只 要 计算 语料库 中 (WW) 这 对 
词 在 统计 的 文本 中 前 后 相 邻 出 现 了 多 少 次 c(W,W) ， 以 及 W,, 本 身 在 同样 的 语料库 中 出 
现 了 多 少 次 ec(W_) ， 然 后 用 两 个 数 分 别 除 以 语料库 的 大 小 ce， 即 可 得 到 这 些 词 或 二 元 组 的 
相对 频 度 ， 再 根据 大 数 定理 ， 只 要 统计 量 足 够 ， 相 对 频 度 就 等 于 概率 : 
POW W) ~£(W,s, W)=c(W, W)/es p(Ws) ~f(W,)=c(W)/e 
所 以 最 后 : 

















P(WiW,) = c(W,, Wi)/c(W.,) 

它们 的 积 P(W) 即 可 求 出 。 

此 处 还 要 用 到 数据 平滑 处 理 技术 ， 它 是 用 来 解决 0 概率 的 问题 ， 产 生 更 准确 的 概率 来 
调整 最 大 似 然 估计 的 一 种 技术 ， 即 提高 低 概率 (如 零 概 率 )， 降 低 高 概率 ， 尽 量 使 概率 分 布 
趋 于 均匀 。 

对 于 二 元 文法 模型 来 说 ， 一 种 最 简单 的 平滑 技术 就 是 假设 每 个 二 元 文法 出 现 的 次 数 比 
实际 出 现 的 次 数 多 一 次 ， 于 是 把 该 处 理 方法 称 为 “加 1 法 ”， 公 式 如 下 : 
l+c(WiWi) _ 1+c(wi,w;) 


Fl+tewaw)] ICl+Dc(ww;) 


其 中 |C| 为 单词 表 中 单词 的 个 数 ， 这 里 指 分 词 后 单词 的 个 数 ， 也 就 是 语料库 的 大 小 。 

(3) 各 实现 模块 分 析 。 

Q@ 初始 化 函数 ， 主 要 包括 6 个 参数 ， 两 个 列表 、 两 个 字典 、 两 个 数值 变量 。 

分 别 为 : 保存 语料库 句子 分 词 的 列表 、 保 存 测试 句子 分 词 的 列表 、 保 存 语料库 句子 分 
词 的 字典 、 保 存 测试 句子 分 词 的 字典 、 概 率 变 量 、 计 数 变量 等 。 

@ 格式 化 函数 : 利用 正则 表达 式 模 块 re 的 函数 和 列表 list 特性 将 句子 内 容 转 变 为 
BEGxxxENDBEGxxxEND 这 种 形式 。 如 下 面 的 例子 。 

语料库 : BEG 把 拆迁 人 民 和 企业 的 生产 安排 好 ， 就 是 生活 和 生产 要 安排 好 ENDBEG 

20170512-06-008-027/m 企业 /nsjnt[ 安 排 ] 保 证 [人 民 ].. 安 排 要 让 企业 有 获得 感 ， 始 终 把 人 
民 放 在 心中 最 高 位 置 ENDBEG 好 人 民 保 证 好 生活 ， 人 民生 活 为 人 民 END 


Pp(Wi| wi)= 
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测试 句子 ，BEG 安排 好 人 民生 活 END 


@ 语料库 句子 中 文 分 词 并 统计 词 频 函 数 : 使 用 jieba 分 词 ， 首 先 用 suggest freq 
(segment, True) 调 节 单个 词语 的 词 频 ， 使 其 能 被 分 出 来 。 然 后 分 词 并 且 统计 词 频 ， 如 果 词 在 
字典 self.dic_test{} 中 出 现 过 则 加 1， 未 出 现 则 等 于 1。 如 下 面 的 例子 。 

分 词 结果 : ['BEG”, “把 ", “拆迁 '", “人民 “和 “企业”, “的 ", “生产 *, “安排 ", 好”,“，’, “就 
是 ，， “生活 ”， “和 生产 "， ee “安排 ”， “好”， ‘END’, ‘BEG’, ‘nn’, ‘20170512’, en “06’, “008’, 
007 4 2 i 企业， 人 二 ‘ns’, 可 有 上 下 “安排 ”， | “保证 ?， 可 “人 民 ，， 3 ee 各 安排, 
“nn, “要 ', 让” “企业 ', “有 ',“ 获 得, “ 感 ',“，’*, “始终 “把 ', “人民 ”, “ 放 在 ”, “心中 ', “最 高 ', “位 
置 , ‘END’, ‘BEG”, 好 “人民 ”， 保证， 好” “生活 ', “，’, "人 民生 活 ”， “为 ", ‘人民 *, ‘END’] 

统计 结果 : {”: 4, “最高: 1, 始终: 1, 和: 2, 人: 3, “有 ”: 1, 安排:: 4， Seed) 
1, “-”: 3, 位置: 1, “wn?: 2, :027: 1, “就 是 : 1,“.”: 2, “和 *: 2, “m?: 1, 生活: 3,' 感 ': 1, “008… 1， 
ee do ot Dim 
“06': 1, “企业 ”: 3, “为: 1 “: 3, “要 ”: 2, “保证 ': 2, 获得: 1, “ 放 在 *: 1} 

统计 以 后 的 字典 是 这 样 的 ， 每 次 输出 词典 内 容 的 顺序 不 固定 。 

@ ”测试 句子 中 文 分 词 并 统计 词 频 函 数 。 

结果 如 下 : 

分 词 结果 :['BEG”, “安排 ", “好 ”, 人民, “生活 ", ‘END] 

统计 结果 : {‘ 人 民 ”: 1, ‘END’: 1, 好: 1, ‘BEG”: 1, “安排 : 1, “生活 : 1} 

@ ”二 元 文法 函数 : 计算 两 个 紧邻 词 一 起 出 现 的 个 数 ， 遍 历 语 料 字符 串 ， 如 果 测 试 和 
语 料 的 两 个 紧邻 的 词 都 相同 ， 则 加 1。 如 : 

[BEG” 安排 :好 “人民 ”生活 ‘END”] 

[Di | 

结果 意义 : 

“BEG 安排 ”在 一 起 出 现 的 次 数 为 0 次 。 

“安排 好 ”在 一 起 出 现 的 次 数 为 2 次。 

“好 人 民 ” 在 一 起 出 现 的 次 数 为 1 次 。 

“人 民生 活 ” 在 一 起 出 现 的 次 数 为 1 次 。 

“生活 END” 在 一 起 出 现 的 次 数 为 0 次 。 

END 之 后 没有 词 ， 所 以 最 后 一 个 的 次 数 为 0 次 。 

@ 计算 概率 函数 。 

用 数据 平滑 处 理 “ 加 1 法 ”， 计算 P(W,|W,)=P(W_,,W)/P(W,)， 并 求 它 们 的 
积 。 如 : 

0.25 

0.15 

0.06 

0.01714285714285714 

0.004285714285714285 

0.0010714285714285713 

输出 最 后 结果 : 0.0010714285714285713 
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(4) Python 程序 实现 : 


import jieba 间 导 入 jieba 分 词 模 块 
import re # 导 入 正则 表达 式 模块 


class GRAM2: 
二 元 文法 类 :计算 一 句 话 在 已 知 语料库 中 出 现 的 概率 
类 初始 化 
字符 串 格式 化 
分 词 并 统计 词 频 cwsl 和 cws2 
二 元 文法 统计 词 出 现 的 次 数 
计算 概率 
list original = [] # 保 存 语 料 库 句子 分 词 列表 
dic original = {} # 保 存 语料库 句子 分 词 字 典 


SEEesE nl # 保 存 测 试 句子 分 词 的 列表 

Eu EE # 保 存 测试 句子 分 词 的 字典 

list count = [] ## 保 存 语料库 紧邻 两 个 分 词 个 数 的 列表 
R= # 概 率 变量 初始 化 

二 要 站 计 数 变量 初始 化 


def init "(self lordorltrdtr lerprE): 
self.1ist original = 1o 
self.dic original = do 
self.list test = 1t 
self.dic test = dt 
self.list count = lc 
self.p p 
Se ‘5 
# 格 式 化 
def forml(self, string para): 
# 存 放 正 则 表达 式 处 理 过 的 字符 串 
tmp = [] 
for i in range (len(string para)): 
# 去 除 类 似 这 样 的 词 "20170512-06-008-027/m" 
if re.compile(r'\d+\-\S+') .match (string para[il]): 
continue 
Slse> 
# 将 类 似 的 词 “中 国 梦 /ns” 蔡 换 为 “中 国 梦 ” 
data = re.compile(r'\/\w+') .sub('\n',string Para[i]l) 
坦 找 到 以 “[? 或 “1 ”开头 的 词 
if re-compile(r'(\[\XS+)1(\]\S+) ') .match (data): 
# 去 除 “] nt [北京 ", “] 天 津 ",“[ 河 北 "，“] . -中 国 梦 " 
三 类 词 的 头 部 无 用 部 分 ( 先 匹 配 长 的 部 分 ) 
ok data = 
re.compile(r'(\J\w+t\DIONI)IONDIN..)').sub('',data) 
tmp.append (ok data) 
continue 
tmp .append (data) 
塌 将 tmp 列表 转换 为 字符 串 
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tmp = "" .join (tmp) 


坦 如 果 是 以 “。?” 结 束 的 则 将 “。?” 删 掉 ， 删 掉 最 后 一 个 。 不 包括 句子 中 的 “。?” 
if tmp .endswith("。") : 
tmpl = mp[s=J 
# 添 加 起 始 符 BEG 和 终止 符 END， 并 蔡 换 句子 中 出 现 的 “。” 
# 将 句子 变 为 “BEGxxxENDxxxxBEGxxxEND” 这 种 形式 
stringl = "BEG" + tmp.replace("。 ", "ENDBEG") + "END" 
return stringl 
# 中 文 分 词 并 统计 词 频 -- 语 料 库 
def cwsl (self, string para): 
# 使 用 suggest freq(segment，True) 调节 单个 词语 的 词 频 ， 使 其 能 被 分 出 来 。 
jieba.suggest freq("BEG", True) 
jieba.suggest freq("END", True) 


#jieba 分 词 
string para = jieba.cut (string para,HMM = False) 
string para form = "/" .join(string para) 


# 将 词 按 “/” 分 割 后 依次 填 入 列表 1ists 

self.1ist original = string para form.split("/") 

# 统 计 字 符 串 词 频 ， 如 果 词 在 字典 ori dict{} 中 出 现 过 则 +1， 未 出 现 则 =1。 

for word in self.1ist original: 

self.dic original[word]l = (self.dic original[word] + 1 

if word in self.dic original else 1) 

anER 语料库 句子 中 文 分 词 结果 为 :") 

print (self.list original) 

print ("——--—-——-—-—-—— 分 词 并 统计 词 频 的 结果 为 : ") 

print(self.dic original) 

return self.list original 


# 中 文 分 词 并 统计 词 频 一 测试 句子 
def cws2(self,string para): 
# 使 用 suggest freq(segment，True) 调节 单个 词语 的 词 频 ， 使 其 能 被 分 出 来 
jieba.suggest freq("BEG", True) 
jieba.suggest freq("END", True) 
#jieba 分 词 
string para = jieba.cut (string para,HMM=False) 
string para form = "/".join(string para) 
# 将 词 按 “/” 分 割 后 依次 填 入 1ists 
self.list test = string para form.split("/") 
# 统 计 词 频 ， 如 果 词 在 字典 dicts{} 中 出 现 过 则 +1， 未 出 现 则 =1 
for word in self.1ist test: 
self.dic test[word] = 
(self.dic test[word] + 1 if word in self.dic test else 1) 


Bin 测试 句子 中 文 分 词 结果 为 : ") 
print (self.1ist test) 
print ("--------- 一 分 词 并 统计 词 频 的 结果 为 : ") 


Print (self.dic test) 
return self.1ist test 


井 二 元 文法 计算 两 个 紧邻 词 一 起 出 现 的 个 数 
def bigram(self,1ist_paral,1ist _para2) : 
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#1ist count 赋值 
initial value = 0 
list length = len(list para2) 
self.list count = [initial value] * (list length) 
# 人 遍历 测试 的 字符 串 
for i in range(len(list para2)-1) : 
# 遍 历 语 料 字符 串 ， 且 因为 是 二 元 文法 
# 不 用 比较 语 料 字符 串 的 最 后 一 个 字符 
for j in range(len(list paral)-2) : 
# 如 果 测 试 和 语 料 的 二 个 紧邻 的 词 都 相同 ， 则 加 1 
if list para2[i]==1ist paral[j] 
and list para2[i+1] == list paral[j+1]: 
self.list count[i] += 1 
print ("———————--—-— 二 元 文法 函数 结果 为 :") 
print (self.list count) 
return 


# 计 算 概率 PP (Wi1Wwi-1)=P (Wi-1,Wi)/P (Wi-1)， 并 求 它们 的 积 
def probability(self,1ist para): 
print ("————-——-—-—-—— 概率 函数 中 间 过 程 为 :") 
for word in list para: 
# 数 据 平滑 处 理 : 加 1 法 
self.p=self.p* (float (self.list count[self.f]+1)/ 
float (self.dic original [word]+1)) 
seit=E = Self Er 
#print ("概率 函数 中 间 过 程 为 :") 
print (self.p) 


print ("-——----—--—-—— 概率 函数 结果 为 : ") 
print (self.p) 
return 
if name ==" main ": 
# 测 试 函数 


def test(): 
stringl = """ 把 拆迁 人 民 和 企业 的 生产 安排 好 ， 就 是 生活 和 生产 要 安排 好 。 
要 让 企业 有 获得 感 ， 始 终 把 人 民 放 在 心中 最 高 位 置 。 好 人 民 保 证 好 生活 ， 人 民生 活 为 人 民 。""" 
string2 = "安排 好 人 民生 活 " 
listl = [] 
list2 = [] 
gram2 = GRAM2([],{},[],{},[],1,0) 
listl = gram2.cwsl (gram2.form(stringl)) 
list2 = gram2.cws2 (gram2.form(string2) ) 
gram2.bigram(1istl,1ist2) 
gram2.probability(1ist2) 
return 
# 调 用 测试 函数 
test () 


输出 结果 如 下 : 


(ea. 
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Building prefix dict from the default dictionary ... 
Loading model from cache C:\Users\ADMINI™ 1\AppData\Local\Temp\ jieba. cache 
Loading model cost 1.103 seconds. 

Prefix dict has been built succesfully 


一 -一 本 料 且 多 了 中 区 分词 结果， 
"REG ， 把， 拆迁， 人民 *，’ 和 | 









































0, 2, 1, 1, 0, 0] 


3333333333333333 

0. 008333333333333333 

i 0 0 
一 一 一- 一 结果 为 
9, 0020833333333333333 


6. 维特 比 算法 练习 
维特 比 算法 是 解决 隐 马 尔 可 夫 模型 预测 问题 的 算法 之 一 ， 本 例 是 对 李 航 的 《统计 


Python 代码 如 下 : 

class HMM: 
mam 隐 马 尔 可 夫 模 型 类 """ 
states = () # 隐 状态 
obs = () # 观 测序 列 


start p = {} # 初 始 概率 ( 隐 状 态 ) 
trans p = {} # 转 移 概 率 ( 隐 状 态 ) 
emit p = {} ， 坦 发 射 概率 ( 隐 状 态 表现 为 显 状态 的 概率 ) 
Dl # 路 径 概 率 表 V[ 时 间 ] [ 隐 状 态 ] = 概率 ，Viterbi 函数 中 使 用 
def init (self,s,o,sp,tp,ep,v): 
Self-states= 3 
selfsobs ="0O 
self.start p sp 
self.trans p tp 
self.emit p = ep 
el 


志 打 印 路 径 概率 表 
def print list(self): 
for j in self.V[0] .keys() : 
print('{0:5s}".format (j)) 
for 七 in range(0,1en(self.V)): 





学 习 
方法 》 一 书 中 的 第 10 章 例 题 10.3 的 Python 实现 ， 详 细 原 理 和 算法 过 程 见 参 考 文献 [17]。 
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print ('{0:6f}'.format (self.V[t] [j])) 
print () 


def Viterbi (self): 
#Viterbi 算法 
# 一 个 中 间 变 量 ， 代 表 当 前 状态 是 哪个 隐 状 态 
path = {} 
# 初 始 化 初始 状态 (t == 0) 


for y in self.states: 


self.V[0] [y] = self.start pl[y] * self.emit pl[ly][self.obs[0]] 


path[y] = [y] 
# 对 t > 0 跑 一 遍 维特 比 算法 
for t in range(1l,len(self.obs)) : 
self.V.append({}) 
newpath = {} 
for y in self.states: 


# 概 率 ， 隐 状态 = 前 状态 是 y0 的 概率 * Y0 转移 到 y 的 概率 * 


#Y 表现 为 当前 状态 的 概率 


(prob, state)=max([(self.V[It-1] [y0]*self.trans P[Y0] [y]* 


self.emit pl[y] [self.obs[t]], y0) for y0 in self.states]) 


# 记 录 最 大 概率 

self.V[t] [y] = prob 

# 记 录 路 径 

newpath[y] = path[state] + [y] 
# 不 需要 保留 旧 路 径 


path = newpath 


(prob, state) = max([(self.V[len(self.obs) - 1][y], y) fory in 


self.states]) 


和 下 


return (prob, path[state]) 


name ==" main ™": 

states = ("boxl"s "box2"” "box3") 

observations = ('red', 'white', 'red') 

Start probability = fbDoxl 0.27 "box2"s /0-45 

transition probability = { 
poxb Do O00 Vox U2 "DozSns 
Oro Dorl = O03 DOr UD DOr 
DOS Dowie = On DO DOr 


一 罗 =) 


} 

emission probability = { 
JOB ee "red O05 white OS 
box2 = [rod O04 White O64 
pox s [red Om Eee St 


Sy 


} 

hmm = HMM (states, 
observations, 
start probability, 
transition probability, 
emission probability, 
GO 


"box3 ' : 


Ose 
0.2}, 
0.5}, 


0.4} 
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print (hmm.Viterbi()) 
print (hmm.print list()) 


输出 结果 如 下 图 6-6 所 示 。 


(0.014699999999999998， ['box3', 


0.280000 
0.042000 





图 6-6 输出 结果 
本 章 小 结 


本 章 对 面向 对 象 技 术 进 行 了 全 面 介绍 。 首 先 介 绍 了 类 的 概念 、 类 的 定义 与 使 用 ， 
Python 中 类 的 作用 域 与 使 用 方法 ， 并 举例 说 明 ， 其 次 介绍 了 类 对 象 支持 的 两 种 操作 ， 介 绍 
了 类 的 属性 和 实例 属性 及 命名 约定 ， 并 对 self 的 使 用 情况 做 了 说 明 ， 然 后 介绍 了 单 继承 和 
多 继承 的 概念 ， 介 绍 了 方法 重 写 等 ， 并 对 isinstance(O) 函 数 、super0 函 数 等 分 别 举例 说 明 ; 
最 后 的 案例 实 训 列举 了 六 个 典型 案例 : 堆 、 栈 、 中 文 分 词 、 类 的 继承 、 二 元 语法 模型 、 维 
特 比 算法 。 


习 是 
1. 填空 题 


(1) 在 Python 中 ， 定 义 类 的 关键 字 是 ( 六 
(2) 类 的 定义 如 下 : 
class person: 


name = 'zhangsan' 
SCoRe = 89 


.(201 \. 


mn 多》 python 程序 设计 实用 教程 


该 类 的 类 名 是 ( )， 其 中 定义 了 ( ) 属 性 和 ( 
属性 。 如 果 在 属性 名 前 加 两 个 下 划 线 (”)， 则 该 属性 是 ( 
对 象 p， 使 用 的 语句 为 ( 

(3) 可 以 从 现 有 的 类 来 定义 新 的 类 ， 这 称 为 类 的 ( 
来 的 类 称 为 ( )、 父 类 或 超 类 。 

(4) 创建 对 象 后 ， 可 以 使 用 ( ) 

(5) 下 列 程序 的 运行 结果 为 ( 六 


class tests 


def init (self,id) : 
self.id=id 
id=345 


t=test (123) 
PrinE (tiay 


(6) 下 列 程序 的 运行 结果 为 ( x 


class teacher: 
def init (self,par): 
self .a=par 
class student (teacher): 


def init (self,par): 
teacher. init (self,par) 
self .b=par 


stu=student (30) 
print (stu.a,stu.b) 


2. 选择 题 
(1) 下 列 说 法 中 不 正确 的 是 ( 。 )。 
A. 类 是 对 象 的 模板 ， 而 对 象 是 类 的 实例 


)， 通 过 来 访问 属性 ， 格 式 为 ( 


) 属 性 ， 它 们 都 是 ( ) 
) 属 性 。 将 该 类 实例 化 ， 创 建 
)( 用 


)， 新 的 类 称 为 ( )， 而 原 


运算 符 来 调用 其 成 员 。 


B. 实例 属性 姓名 如 果 以 _( 双 下 划 线 ) 开 头 ， 就 变 成 了 一 个 私有 变量 
C. 只 有 在 类 的 内 部 才 可 以 访问 类 的 私有 变量 ， 在 外 部 不 能 访问 


D. 在 Python 中 ， 一 个 子 类 只 能 有 一 个 父 类 


(2) 下 列 选 项 中 不 是 面向 对 象 程序 设计 基本 特征 的 是 ( 
C. 可 维护 性 
(3) 在 方法 定义 中 ， 访 问 实例 属性 X 的 格式 是 (  )。 


A. 继承 B. 多 态 
A.x B. selfx 
(4) 下 列 程序 的 执行 结果 是 ( 。”)。 
class Point: 
x=15 
y=5 
def 


C. self[x] 


init 
SEL 
p=Point (25, 25) 
print (p.x,p-y) 


(self, XY 


(Zo. 


)。 
D. 封装 


D. self.getx( ) 


(5) 


A.1525 B.2515 
下 列 程序 的 执行 结果 是 ( )。 


Class RU 
asls 

class Al(A): 
pass 

print (A.a,Al.a) 


Cs 


A.1515 B. 15 pass C.pass 15 


3. 问答 题 


(1) 
(2) 
G3) 
(4) 


面向 对 象 程序 设计 的 三 要 素 是 什么 ? 


简单 解释 Python 中 以 下 划 线 开头 的 变量 名 之 特点 。 
在 Python 中 导入 模块 中 的 对 象 有 哪 几 种 方式 ? 


Python 生成 一 个 随机 数 的 方法 有 哪些 ? 


4. 实验 操作 题 
(1) 定义 动物 类 ， 跑 为 属性 ， 再 定义 一 个 猫 类 ， 名 字 为 属性 ， 实 现 继承 功能 ， 并 实例 


化 调用 。 
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WW 


D. 运行 出 错 


(2) 定义 Person 类 ， 生 成 Student 类 ， 填 写 新 的 函数 用 来 设置 学 生 专业 ， 然 后 生成 该 


类 对 象 并 显示 信息 。 


(3) 设计 一 个 三 维 向 量 类 ， 并 且 实 现 向 量 的 加 法 、 减 法 以 及 向 量 与 标量 的 乘法 和 除法 


运算 。 


(4) 编写 类 并 且 定 义 函 数 ， 可 以 接收 任意 多 个 整数 ， 并 输出 其 中 的 最 大 值 和 所 有 整数 


(5) 定义 类 并 编写 函数 ， 可 以 接收 一 个 字符 串 ， 分 别 统计 大 写字 母 、 
字 、 其 他 字符 的 个 数 ， 并 以 元 组 的 形式 返回 结果 。 


小 写字 母 、 数 
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本 章 要 点 


(1) 数据 库 技术 基础 。 

(2) SQLite 数据 库 的 数据 类 型 、 基 本 操作 。 

(3) MySQL 数据 库 的 数据 类 型 、 基 本 操作 。 

(4) 使 用 Python 操作 SQLite 数据 库 、MySQL 数据 库 。 

学 习 目标 

(1) 了 解数 据 库 的 基本 概念 。 

(2) 理解 SQLite 数据 库 和 MySQL 数据 库 的 数据 类 型 。 

(3) 熟悉 SQLite 数据 库 和 MySQL 数据 库 的 基本 操作 。 

(4) 掌握 如 何 使 用 Python 操作 SQLite 数据 库 与 MySQL 数据 库 。 


前 面 各 章 对 Python 语言 的 基础 知识 进行 了 详细 的 介绍 ， 本 章 及 后 面 各 章 将 陆续 介绍 
Python 的 一 些 实际 应 用 ， 旨 在 让 读者 能 更 加 清晰 地 了 解 Python 这 门 编程 语言 的 魅力 。 本 章 
主要 介绍 如 何 使 用 Python 进行 数据 库 开发 。 

一 般 情 况 下 ， 绝 大 多 数 应 用 程序 都 需要 使 用 数据 库 来 存放 数据 。Python 支持 多 种 数据 
库 ， 使 用 相应 的 模块 即 可 连接 到 数据 库 进行 编程 。 

因 本 书 篇 幅 所 限 ， 本 章 仅 介绍 两 种 关系 型 数据 库 一 一 SQLite 数据 库 与 MySQL 数据 
库 ， 重 点 介绍 在 Python 中 如 何 进行 数据 库 编程 。 


7.1 数据 库 技术 基础 


7.1.1 数据 库 的 基本 概念 


数据 库 (Database，DB) 是 存储 数据 的 仓库 ， 是 长 期 存放 在 计算 机 内 、 有 组 织 、 可 共享 
的 大 量 数据 的 集合 。 数 据 库 中 的 数据 按照 一 定 的 数据 模型 组 织 、 描 述 和 存储 ， 具 有 尽 可 能 
小 的 宛 余 度 ， 同 时 ， 具 有 较 高 的 独立 性 和 易 扩 展 性 。 

数据 库 管理 系统 (Database Management System，DBMS) 是 位 于 用 户 与 操作 系统 之 间 的 
一 层 数据 库 管 理 软件 ， 帮 助 用 户 向 计算 机 中 输入 、 管 理 大量 的 数据 ， 方 便 用 户 定义 数据 、 
操作 数据 和 维护 数据 。 其 主要 功能 包括 如 下 几 种 。 

(1) 数据 定义 功能 :提供 数据 定义 语言 (Data Definition Language，DDL)， 方 便 用 户 对 
数据 库 中 的 数据 对 象 进行 定义 。 

(2) 数据 操作 功能 :提供 数据 操纵 语言 (Data Manipulation Language，DML)， 可 以 对 
数据 库 中 的 数据 进行 查询 、 插 入 、 删 除 和 修改 等 基本 操作 。 

(3) 数据 库 的 管理 和 维护 ， 对 数据 库 进 行 统一 管理 控制 ， 以 保证 其 安全 性 、 完 整 性 、 
一 致 性 ， 并 实现 多 用 户 环境 下 的 并 发 使 用 。 

数据 库 系 统 (Database System，DBS) 是 指 在 计算 机 系统 中 引入 数据 库 后 组 成 的 系统 。 
数据 库 系 统一 般 由 数据 库 、 操 作 系统 、 数 据 库 管理 系统 (及 其 开发 工具 )、 应 用 系统 、 数 据 
库 管理 员 和 用 户 组 成 ， 如 图 7-1 所 示 。 
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数据 库 管理 员 





图 7-1 数据 库 系 统 的 组 成 


数据 库 、 数 据 库 管 理 系统 和 数据 库 系 统 是 三 个 不 同 的 概念 ， 数 据 库 强调 的 是 数据 ， 是 
数据 库 管理 系统 的 管理 对 象 ， 数据 库 管理 系统 强调 的 是 管理 软件 ， 是 数据 库 系统 的 组 成 章 
分 ， 而 数据 库 系 统 强调 的 是 系统 。 


7.1.2 ”数据库 的 类 型 


根据 数据 存储 模型 ， 可 将 数据 库 分 为 层次 数据 库 、 网 状 数据 库 、 关 系数 据 库 、 面 向 对 
象 数据 库 等 。 目 前 常见 的 数据 库 主 要 有 两 大 类 ， 即 关系 型 数据 库 和 非 关 系 型 数据 库 ， 本 节 
主要 介绍 前 者 。 目 前 常见 的 关系 型 数据 库 有 Oracle、MySQL、SQL Server、SQLite、 
DB2、Sybase、Informix 等 。 

关系 型 数据 库 是 建立 在 关系 模型 基础 上 的 。 关 系 模型 是 指 用 二 维 表 的 形式 来 表示 实体 
和 实体 间 联 系 的 数据 模型 。 实 体 是 指 现实 世界 中 具有 一 定 特 征 或 属性 并 客观 存在 的 数据 对 
象 ， 实 体 与 实体 间 的 联系 可 以 分 为 以 下 三 种 。 

(让 一 对 一 联系 : 如 一 个 工厂 只 能 有 一 个 厂 长 ， 而 一 个 厂 长 具 能 在 一 个 工厂 任职 , 王 
厂 和 厂 长 为 一 对 一 的 联系 。 

(2) 一 对 多 联系 : 如 一 个 班级 有 多 名 学 生 ， 而 一 名 学 生 只 能 在 一 个 班级 里 ， 班 级 和 学 
生 为 一 对 多 的 联系 。 

(3) 多 对 多 联系 : 如 一 名 学 生 可 以 选择 多 门 选修 课程 ， 而 一 门 选修 课程 可 以 被 多 名 学 
生 选 择 ， 学 生 和 课程 是 多 对 多 的 联系 。 

在 关系 模型 中 ， 一 个 关系 对 应 着 一 张 二 维 表 ， 一 张 二 维 表 由 行 和 列 组 成 。 表 的 一 行 称 
为 一 个 记录 ， 描 述 一 个 具体 实体 的 一 组 数据 ， 例 如 表 7-1 所 示 的 学 生 信息 表 中 ， 学 号 为 
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201701、 姓 名 为 李 丽 、 性 别 为 女 、 出 生日 期 为 1993-01-12、 籍 贯 为 天 津 的 一 组 数据 为 一 个 
记录 。 表 的 列 称 为 字段 ， 描 述 实 体 的 一 个 特征 或 属性 ， 例 如 表 7-1 所 示 的 学 生 信 息 表 中 的 
学 号 、 姓 名 、 性 别 、 出 生日 期 、 籍 贯 就 是 字段 。 每 个 表 中 通常 都 有 一 个 关键 字 ， 一 个 可 以 
唯一 标识 一 条 记录 的 字段 ， 例 如 表 7-1 中 的 学 号 。 








表 7-1 学 生 信息 表 













201701 
201702 
201703 





1993-01-12 
1993-02-22 | 唐山 
1994-12-01 

















关系 数据 库 最 大 的 特点 是 事务 的 一 致 性 ， 这 使 得 它 并 不 适用 于 大 数据 量 的 Web 系统 ， 





于 是 ， 非 关系 型 数据 库 应 运 而 生 。NoSQL(Not Only SQL) 泛 指 非 关系 型 的 数据 库 ，NoSQL 
数据 库 基本 上 不 进行 复杂 的 处 理 ， 只 应 用 在 特定 的 领域 ， 是 对 传统 关系 型 数据 库 的 一 个 有 
效 补充 。 由 于 它 可 以 为 大 数据 建立 快速 、 可 扩展 的 存储 库 ， 因 而 得 到 了 非常 迅速 的 发 展 。 

非 关 系 型 数据 库 可 以 分 为 四 大 类 : 键 值 对 存储 (key-value store) 数 据 库 ， 如 Redis、 
Voldemort、Tokyo Cabinet/Tyrant、Oracle BDB 等 ， 列 存储 (Column-oriented) 数 据 库 ， 如 
Cassandra、HBase、Riak 等 ; 文档 存储 (Document Store) 数 据 库 ， 如 CouchDB、MongoDb 
等 ， 图 形 (Graph) 数 据 库 ， 例 如 Neo4J、InfoGrid、Infinite Graph 等 。 在 这 四 类 非 关 系 型 数据 
库 中 ， 每 一 种 都 可 解决 相应 的 问题 ， 这 些 问 题 是 关系 型 数据 库 所 不 能 解决 的 。 


7.2”SQLite 数据 库 


SQLite 数据 库 是 一 款 非常 小 巧 的 开源 嵌入 式 数 据 库 ， 占 用 的 资源 非常 低 ， 能 够 支持 
Windows、Linux、Unix 等 主流 操作 系统 ， 同 时 ， 能 跟 很 多 编程 语言 结合 ， 比 如 Python、 
C#、PHP、Java 等 。 


7.2.1 ” SQLite 数据库 的 下 载 和 安装 


进入 SQLite 下 载 页 面 ，http://www.sqlite.org/download.html， 在 如 图 7-2 所 示 的 界面 找 
到 Precompiled Binaries for Windows 一 项 ， 下 载 Windows 下 的 预 编译 二 进 制 文件 包 sqlite- 
tools-win32-x86-<build#>.zip 和 sqlite-dll-win32-x86-<build#>.zip(<build#> 是 sqlite 的 编译 版 
本 号 )。 

当前 最 新 版 本 的 安装 包 为 sqlite-tools-win32-x86-3180000.zip， 对 应 的 版 本 是 sqlite3。 
将 安装 包 下 载 并 解压 到 磁盘 中 ， 并 将 解压 后 的 目录 添加 到 系统 的 PATH 环境 变量 中 (加 入 
PATH 环境 变量 是 为 了 直接 在 命令 行 上 使 用 sqlite3)。 

打开 DOS 命令 提示 符 窗 口 ， 输 入 sqlite3 命令 并 按 Enter 键 ， 如 果 安 装 成 功 ， 则 显示 如 
7-3 所 示 的 信息 。 
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图 7-2 SQLite 下 载 页 界面 


画 命令 提示 符 - sqlite3 





7-3 ”SQLite 命令 行 窗口 
7.2.2 ”SQLite 数据 类 型 
SQLite 支持 的 数据 类 型 如 表 7-2 所 示 。 


表 7-2 SQLite 支持 的 数据 类 型 











空 
INTEGER. | 值 是 一 个 带 符号 的 整数 
REAL 浮 
TEXT 











值 是 一 个 二 进 制 数 ， 完 全 根据 它 的 输入 存储 
但 实际 上 ，SQLite3 也 接受 如 表 7-3 所 示 的 数据 类 型 。 


表 7-3 SQLite3 支持 的 数据 类 型 








数据 类 型 描 述 
SMALLINT 16 位 的 整数 
小 数 ，P 指数 字 的 位 数 ，S 指 小 数 点 后 数 的 位 数 ， 如 果 没 有 特别 指定 ， 则 系统 会 
DECIMAL(P,S) 


默认 为 P=5，S=0 
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续 表 
数据 类 型 描 述 
FLOAT 32 位 的 浮 点 数 
DOUBLE 64 位 的 实数 
CHAR(N) 长 度 为 N 的 字符 串 ，N<254 
VARCHAR(N) 可 变 长 度 且 其 最 大 长 度 为 N 的 字符 串 ，N<4000 
ee 和 CHAR(GN) 一 样 ， 不 过 其 单位 是 两 个 字 节 ，N 近 127。 这 个 形态 是 为 了 支持 两 个 
字 节 长 度 的 字体 ， 例 如 中 文 文字 
VARGRAPHIC(N) 可 变 长 度 且 其 最 大 长 度 为 N 的 双 字 节 字 符 串 ，N 达 4000 
DATE 包含 了 年 、 月 、 日 
TIME 包含 了 时 、 分 、 秒 
TIMESTAMP 含 了 年 、 月 、 日 、 时 、 分 、 秒 、 千 分 之 一 秒 
DATETIME 含 日 期 和 时 间 





7.2.3 创建 SQLite 数据 库 


在 运行 SQLite 数据 库 的 同时 ， 可 通过 下 面 的 命令 创建 数据 库 : 

sqlite3 数据 库 文件 名 

SQLite 数据 库 文件 的 扩展 名 为 .db。 如 果 指 定 的 数据 库 文件 存在 ， 则 打开 数据 库 ， 和 否则 
在 当前 目录 下 创建 该 数据 库 ， 并 通过 下 面 的 命令 来 保存 数据 库 : 

.Save 数据库 文件 名 

【 例 7-1】 创 建 SQLite 数据 库 SQLitedb.db: 

sqlite3 SQLitedb .db 


还 注 意 :， 该 命令 是 在 DOS 命令 提示 符 下 输入 的 ， 并 不 是 在 SQLite 命令 提示 符 下 输 





入 的 。 
7.2.4 SQLite 的 基本 操作 
1. 创建 表 


使 用 CREATE TABLE 语句 创建 表 的 语法 格式 为 : 


CREATE TABLE 表 名 


( 
列 名 1 数据 类 型 字段 属性 ， 
列 名 2 数据 类 型 字段 属性 ， 
列 名 n 数据 类 型 字段 属性 
3 
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常用 的 字段 属性 如 表 7-4 所 示 。 
表 7-4 常用 的 字段 属性 


字段 属性 描 述 











PRIMARY KEY | 设置 指定 列 为 主键 ， 用 于 确保 记录 的 唯一 性 
NOT NULL | 设置 指定 列 的 值 不 允许 为 空 
UNIQUE 设置 指定 列 所 有 值 除 NULL 外 都 不 相同 





DEFAULT 设置 指定 列 的 默认 值 
CHECK 设置 指定 列 的 检查 条 件 ， 确 保 指 定 列 中 的 所 有 值 满足 该 条 件 








【 例 7-2】 创 建 学 生 课程 表 Course， 表 结构 如 表 7-5 所 示 。 
表 7-5 表 Course 的 结构 


字 自 字段 说 明 
CNo 课程 编号 (主键) 
CName 课程 名 称 (不 为 空 ) 
CCredits 学 分 (认为 必 
Crime 总 学 时 
CTem 学 其 


使 用 CREATE TABLE 语句 创建 表 Course 的 语句 为 : 


CREATE TABLE Course 
( 





CNo char(4) PRIMARY KEY, 
CName Varchar (50) NOT NULL, 
CCredits decimal (4,1) DEFRAULT (4) ， 
CTime decimal (3,0), 
CTerm char (11) 

) 7 


执行 下 面 的 语句 可 以 查看 当前 数据 库 中 所 有 的 表 : 

.tables 

使 用 下 列 语句 可 以 查看 表 的 结构 : 

select * from sqlite master where type='table' and name=' 表 名 '; 
或 者 : 


.Schema 





2. 向 表 中 插入 数据 


一 旦 把 表 创 建 好 ， 就 可 以 向 表 内 插入 数据 了 。 可 以 使 用 INSERT 语句 向 表 内 插入 数 
据 ， 语 法 格式 为 ( 列 与 值 必须 一 一 对 应 ): 





(aN. 
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INSERT INTO 表 名 ( 列 名 1， 列 名 2，...， 列 名 n) 
VaALUESI( 信 TO 信 2 人 信 n)y 


【 例 7-3】 参 照 表 7-6， 向 Course 表 中 插入 数据 。 
表 7-6 表 Course 中 插入 的 数据 


CNo CName CCredits CTerm 
0001 英语 2 36 


0002 EE 


0003 数据 结构 54 
0004 c 语 言 54 
0005 数据 库 系 统 概论 18 
0006 操作 系统 18 


INSERT 语句 如 下 : 


INSERT INTO Course (CNo,CName,CCredits,CTime,CTerm) VALUES ('0001', 
0 并 证 和 367 "27 

INSERT INTO Course (CNo,CName,CCredits,CTime,CTerm) VALUES ('0002', 
' 高 等 数学 ' ,3, 36, '2'); 

INSERT INTO Course (CNo, CName, CTime,CTerm) VALUES ('0003'，' 数 据 结构 ' ， 
54,'2'); 

INSERT INTO Course (CNo,CName,CCredits,CTime,CTerm) VALUES ('0004', 
Men 2 区) 克 

INSERT INTO Course (CNo,CName,CCredits,CTime,CTerm) VALUES (!0005'"， 
"数据 库 系 统 概 论 ",2,18, '2'); 

INSERT INTO Course (CNo,CName,CCredits,CTime,CTerm) VALUES ('0006', 
"操作 系统 27 18 2); 


使 用 可 视 化 工具 SQLiteStudio 可 显示 例 7-3 所 创建 的 表 Course， 如 图 7-4 所 示 。 
加 "加 加 四 | 回回 | 二 加 钱粮 | 只 























CNo CName CCredits CTlime CTerm 
1 0001 英语 2 36 2 
2 0002 高 等 数学 3 36 2 
3 0003 数据 结构 4 542 
4 0004 < 语言 3 54 2 
5 0005 数据 库 系统 概论 2 18 2 
6 0006 操作 系统 2 182 


图 7-4 例 7-3 所 创建 的 表 Course 
3 大 注意 : 为 了 方便 读者 查询 各 条 语句 执行 后 的 结果 ， 部 分 例题 的 结果 显示 使 用 了 可 视 
化 工具 SQLiteStudio。 
3. 修改 表 中 的 数据 
修改 数据 可 以 使 用 UPDATE 语句 来 实现 ， 其 语法 格式 为 : 


UPDATE 表 名 SET 列 名 1= 值 1， 列 名 2= 值 2，.- - -.， 列 名 n= 值 n 
WHERE 条 件 表达 式 ; 
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该 语句 的 功能 是 修改 表 中 满足 WHERE 子 句 条 件 的 记录 。 其 中 SET 子 句 用 于 指定 修改 
方法 ， 即 列 1 的 值 被 设置 为 值 1， 列 2 的 值 被 设置 为 值 2， 列 mn 的 值 被 设置 为 值 n。 如 果 省 
略 WHERE 子 句 ， 则 表 中 所 有 的 记录 都 将 被 修改 。 

【 例 7-4】 将 表 Course 中 CName 为 操作 系统 的 记录 中 的 学 时 CTime 修改 为 36: 

UPDATE Course SET CTime=36 WHERE CName=' 操 作 系 统 '; 

4. 删除 数据 

随 着 使 用 和 对 数据 的 修改 ， 表 中 可 能 存在 一 些 无 用 的 数据 。 可 以 使 用 DELETE 语句 删 
除 表 中 的 数据 ， 其 语法 格式 如 下 : 

DELETE FROM 表 名 WHERE 删除 条 件 ; 

DELETE 语句 的 功能 是 将 指定 表 中 满足 WHERE 子 句 条 件 的 所 有 记录 删除 。 如 果 没 有 
提供 WHERE 子 句 ， 则 DELETE 语句 将 删除 表 中 的 所 有 记录 ， 但 表 的 结构 仍 在 ， 也 就 是 
说 ，DELETE 语句 删除 的 只 是 表 中 的 数据 。 

【 例 7-$】 删 除 表 Course 中 课程 号 CNo 为 0004 的 记录 : 

DELETE FROM Course WHERE CNo="'0004'; 

5. 查询 数据 

使 用 SELECT 语句 查询 表 中 的 数据 ， 语 句 的 一 般 格式 为 : 

SELECT 列 名 1， 列 名 2，...， 列 名 n FROM 表 名 WHERE 查询 条 件 ; 

当 执 行 SELECT 语句 时 ， 指 定 的 表 中 所 有 满足 WHERE 子 句 条 件 的 数据 都 将 被 返回 。 
如 果 没 有 提供 WHERE 子 句 ， 则 SELECT 语句 将 返回 所 有 记录 中 指定 的 字段 值 。 如 果 要 查 
询 表 中 的 所 有 字段 ， 可 以 用 “*” 代 替 “ 列 名 1, 列 名 2,.…, 列 名 n”。 

【 例 7-6】 查 询 表 Course 中 学 分 CCredits 为 2 的 课程 编号 CNo 和 课程 名 称 CName: 

SELECT CNo, CName FROM Course WHERE CCredits=2; 

查询 结果 如 图 7-5 所 示 。 

【 例 7-7】 返 回 表 Course 中 的 所 有 信息 : 





SELECT * FROM Course; 


查询 结果 如 图 7-6 所 示 。 











CNo CName CCredits CTlime CTerm 
1 0001 英语 [1 36 2 
2 0002 高 等 数学 3 36 2 
3 0003 数据 结构 4 542 
4 0005 数据 库 系统 概论 2 18 2 
5 0006 把 作 系统 2 36 2 
7-5 例 7-6 的 查询 结果 7-6 例 7-7 的 查询 结果 


千 注意 : 例 7-7 的 查询 是 在 例 7-4 和 例 7-5 的 基础 上 ， 故 在 查询 结果 中 CName 为 操作 
系统 的 CTime， 已 更 改 为 356， 而且 删除 了 CNo 为 0004 的 记录 。 
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7.2.5 ”使 用 Python 操作 SQLite 数据 库 


Python 标准 库 中 带 有 sqlite3 模块 ， 使 用 sqlite3 模块 操作 数据 库 的 基本 步骤 如 下 。 
1. 导入 sqlite3 模块 
使 用 如 下 语句 从 Python 标准 库 导 入 sqlite3 模块 : 
import sqlite3 
2. 建立 数据 库 连 接 
调用 数据 库 模块 中 的 connect0 方 法 建立 数据 库 连接 ， 指 定数 据 库 文件 名 。 语 法 格式 如 下 : 
数据 库 连 接 对 象 =sqlite3 .connect (数据 库 名 ) 
【 例 7-8】 使 用 connect0 方 法 在 本 地 磁盘 D 中 创建 数据 库 test.db: 
co=sqlite3.connect(r"D:Ntest.db") 
数据 库 名 是 包含 绝对 路 径 的 数据 库 文 件 名 。 如 果 Di:\test.db 存在 ， 则 打开 数据 库 ， 和 否则 
创建 并 打开 数据 库 D:\test.db。 打 开 数 据 库 时 返回 的 对 象 co 就 是 一 个 数据 库 连 接 对 象 。 
使 用 如 下 方法 可 以 创建 一 个 内 存 数据 库 : 
数据 库 连接 对 象 =sqlite3.connect (":memory:") 
3. 创建 游标 对 象 
调用 cursor0 方 法 创建 游标 对 象 : 
游标 对 象 = 数据 库 连 接 对 象 .cursor () 
4. 调用 execute() 方 法 执行 SQL 语句 
调用 execute() 方 法 执行 SQL 语句 的 具体 方法 如 表 7-7 所 示 。 
表 7-7 调用 execute() 方 法 执行 SQL 语句 的 具体 方法 

















具体 方法 描 述 
执行 一 条 SQL 语句 
执行 一 条 带 参数 的 SQL 语句 
执行 多 条 带 参数 的 SQL 语句 
执行 SQL 脚本 





游标 对 象 .execute(sqD) 

游标 对 象 .execute(sql, parameters) 
游标 对 象 .executemany(sql, parameters) 
游标 对 象 .executescript(sql]_script) 


SQL 语句 中 的 参数 可 以 使 用 占 位 符 “?” 代 蔡 ， 并 在 随后 的 传递 参数 中 使 用 元 组 给 出 
具体 值 ， 或 使 用 命名 参数 ， 传 递 参数 使 用 字典 。 

【 例 7-9】 在 数据 库 D:\test.db 中 使 用 execute() 方 法 执行 SQL 语句 创建 表 Course， 并 
插入 数据 : 

import sqlite3 

co=sqlite3.connect (r"D:\test.db") 

cu=co.cursor() 
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cu.execute ("CREATE TABLE CouTrse (CNo char (4) PRIMARY KEY,CName Varchar (50) 
not null,CCredits decimal (4,1) default(4) ,CTime decimal (3,0) ， 

CTerm char (11) )") 

cu.execute ("INSERT INTO Course (CNo,CName,CTime,CTerm) VALUES ('0003°', 
' 数 据 结构 ' ,54, '2"')") 

cu.execute ("INSERT INTO Course VALUES (?,?,?,2?,2)", ("0001"', 
36) 

a=[ ('0002',' 高 等 数学 ', 3, 36, '2'), ("0004','c 语言 ', 3,54, '2'), ("0005'，, 
"数据 库 系统 概论 ',2, 18, '2'), ("0006'，,' 操 作 系 统 ',2, 18, '2')] 

cu.executemany ("INSERT INTO Course VALUES (?,?,?,?,?)",a) 

co.commit () 间 提 交 数 据 


使 用 可 视 化 工具 SQLiteStudio 可 查看 到 例 7-9 所 创建 的 表 Course， 如 图 7-7 所 示 。 











ClHane Ceredits Cline CTern 
数据 结构 4 54 2 
2 36 2 
高 等 数学 3 36 2 
< 语言 3 54 2 
数据 库 系统 概论 2 18 2 
操作 系统 2 18 2 


7-7 例 7-9 所 创建 的 表 Course 
5. 获取 游标 的 查询 结果 
获取 游标 的 查询 结果 的 具体 方法 如 表 7-8 所 示 。 
表 7-8 ”获取 游标 的 查询 结果 的 具体 方法 


获取 结果 集 的 下 一 条 记录 ， 无 数据 时 返回 None 





游标 对 象 .fetchmany(n) 获取 结果 集中 的 n 条 记录 ， 无 数据 时 返 
游标 对 象 .fetchall0 获取 结果 集中 的 所 有 记录 ， 无 数据 时 返 
游标 对 象 .rowcountO) 获取 影响 的 行 数 、 结 果 集 的 行 数 




















【 例 7-10】 在 数据 库 Di\test.db 中 使 用 游标 查询 表 Course 中 的 数据 : 


import sqlite3 

co=sqlite3.connect (r"D:\test.db") 

cu=co. cursor() 

cu.execute ("SELECT * FROM Course ORDER BY CNo") 
print(cu. fetchone()) 

print(cu. fetchall()) 


查询 结果 如 图 7-8 所 示 。 


<sqlite3. Cursor object at Ox000002ACE9199180> 
>>> print(cu. fetchone()) 
《0001 ，' 英语 ，2，36, "2 ) 
>> pri chall()) 
数学 ' ，3;，36, “2' )，(〈 0003` ,，“ 数据 结构 "，4, ,54, “2 ),,( 0004 ， 
“c 语 言 " 。3。54; “2  )。(〈 0005’ . “数据 库 系 统 概论 。2。18，’ 2  )， (0006" . “操作 系 
2 
>>> print(cu. fetchone()) 
Sa 
>>> 





图 7-8 例 7-10 的 查询 结果 
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6. 数据 库 的 提交 和 回 滚 
(1) 提交 数据 库 。 
语法 格式 ， 数据 库 连 接 对 象 .commit() 
功能 : 提交 当前 事务 。 
对 注意 : 如果 关闭 数据 库 连 接 前 未 调用 commit() 方 法 ， 则 自 上 一 次 调用 commit() 方 法 
以 来 对 数据 库 的 更 改 全 部 丢失 。 


(2) 回 滚 数据 库 。 

语法 格式 : 数据库 连接 对 象 .rollback() 

功能 : 回 深 自 上 一 次 调用 commit() 方 法 后 对 数据 库 所 做 的 更 改 。 

7. 关闭 cursor 对 象 和 connect 对 象 

(1) 关闭 游标 对 象 : 

游标 对 象 .close () 

(2) 关闭 数据 库 连 接 对 象 : 

数据 库 连 接 对 象 .close () 

数据 库 连 接 对 象 使 用 完毕 后 ， 应 养 成 及 时 关闭 的 好 习惯 ， 以 免 造 成 数据 丢失 。 


7.3 MySQL 数据 库 


MySQL 是 一 个 多 用 户 、 多 线程 的 关系 型 数据 库 管理 系统 ， 其 工作 模式 是 基于 客户 机 / 
服务 器 结构 的 ， 具 有 开放 性 、 多 线程 、 支 持 多 种 API、 跨 数据 库 连 接 、 国 际 化 、 巨 大 的 数 
据 库 规模 等 特点 。 目 前 它 可 以 支持 几乎 所 有 的 操作 系统 ， 包 括 Windows 系列 以 及 Unix 系 
列 等 操作 系统 。 由 于 其 体积 小 、 速 度 快 、 总 体 拥有 成 本 低 ， 尤 其 是 开放 源码 这 一 特点 ， 许 
多 中 小 型 网 站 为 了 降低 网 站 总 体 成 本 ， 而 选择 MySQL 作为 网 站 数据 库 。 


7.3.1 ”MySQL 数据 库 的 下 载 和 安装 


访问 MySQL 网 址 http://dev.mysql.com/downloads/， 下 载 mysql-installer-community-5.7. 
17.0.msi 文件 。 本 节 以 MySQL5.7.17 为 例 ， 介 绍 MySQL 数据 库 的 安装 过 程 。 

双击 mysql-installer-community-5.7.17.0.msi 文件 ， 打 开 MySQL Installer 安装 向 导 ， 出 
现 如 图 7-9 所 示 的 界面 ， 选 中 I accept the license terms 复 选 框 ， 然 后 单 击 Next 按钮 ， 进 入 
配置 安装 类 型 界面 ， 如 图 7-10 所 示 。 

用 户 可 以 选择 下 面 5 种 安装 类 型 。 

(1) Developer Default: 安装 开发 MySQL 应 用 程序 所 需 的 所 有 产品 ， 例 如 MySQL 
Server、 MySQL Workbench、MySQL 连接 器 等 。 

(2) Server only: 只 安装 MySQL Server 产品 。 

(3) Client only: 只 安装 MySQL 客户 端 产品 ， 例 如 MySQL Workbench、MySQL 连接 
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(4) Full: 完全 安装 。 
(5) Custom: 自 定义 安装 。 


图 MysQL Installer 






MySQL. Installer License Agreement 
Adding Comm 
To proceed you must accept the Oracle Software License Terms. 





GNU GENERAL PUBLIC UCENSE ~ 
Version 2, June 1991 


|Copyright (C) 1989, 1991 Free Software Foundation, nc 
51 Franklin Street, Fifth Floor Boston, MA 02110-1301 USA 
|Everyone s permitted to copy and distribute verbatim copies 
|of this lcense document but changing it is not alowed 


|preamble 





[The icenses for most software are designed to take away your freedom 

lto share and change it. By contrast, the GNU General Public License is 
intended to guarantee your freedom to share and change free 
|software--to make sure the software is free for all its users. This 

|General Public License applies to most of the Free Software 

|Foundation's software and to any other program whose authors commit to 
using tt. (Some other Free Software Foundation software is covered by 
lthe GNU Library General Public License instead,) You can apply tto 

lyour programs, too 


When we speak of free software, we are refering to freedom, not price 
|our General Public Lice designed to make sure that you have 
he feednmn tn richihvde rnmiee nk fyee cnfhware fandl charme fne thic 











日 





ccept the license terms 


Nedt> Cancel 





7-9 MySQL Installer 安装 向 导 


圆 MysQL Installer 


MySQL Installer Choosing a Setup Type 
A mmunity 


Please select the Setup Type that suits your use case. 


图 Developer Default Setup Type Description 
i a Installs the MySQL Server and the tools 六 
My5QL development purposes. required for MySQL application development. 

This is useful ff you intend to develop 

[applications for an existing server. 








© Serverony 


Installs only the MySQL Sever This Setup Typeindudes 
product. 


“MYSQL Server 
O Chent only 


Iinstalls only the MySQL Chent 
products, without a se 


.MySQL Workbench 
The GUI application to develop for and 
Imanage the server 





OF “MySQLfor Excel 
Installs allinduded NSCL excel plug-in to easily access and manipulate 
products and features. IMySQL data, 


" MySQL for Visual Studio 


© Com |To work with the MySQL Server from VS, 


Manually select the products that 
should be installed on the 


system, MySQL Connectors 


(Connector/Net, Java, C/C++, OBDC and 
lothers. > 








< Back Net> Cancel | 


7-10 配置 安装 类 型 界面 




















选择 Full 进行 完全 安装 ， 默 认 安装 路 径 为 C:\Program Files\MySQLJMYSQL 。 单 击 
Next 按钮 ， 打 开 检 查 组 件 窗口 ， 如 图 7-11 所 示 。 如 果 安 装 过 程 中 提示 缺少 组 件 ， 则 安装 
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组 件 后 再 尝试 安装 MySQL 数据 库 。 在 本 节 中 选择 安装 了 MySQL 可 视 化 工具 MySQL 
Workbench 6.3.8， 因 为 下 面 一 些 例题 的 结果 要 使 用 该 工具 进行 展示 。 如 果 有 些 产 品 不 需要 














用 的 话 ， 则 不 需要 安装 这 些 额外 组 件 ， 直 接 单 击 Next 按钮 就 可 以 了 。 这 时 ， 会 弹出 一 个 
窗口 ， 忽 略 它 ， 直 接 单 击 Yes 按钮 ， 然 后 进入 安装 窗口 ， 如 图 7-12 所 示 ， 单 击 Execute 按 


钮 开始 安装 。 


lySQL Installer 









MySQL Installer 


Addir mmunity 


加 MysQt Installer 





MySQL Installer 


munity 


Check Requirements 


Thefollowing products have failing requirements. The installer will attempt to resolve some 
of this automatically. Requirements marked as manual cannot be resolved automatically. 
Click on those items to ty and resolve them manually. 





For Product Requirement 
O MySQL Workbench 6.3.8 Microsoft Visual C** 2013 Runtime... 
O MysQL For Excel 13.6 Visual Studio Tools for Office 2010 js- 
OO MySQL For Excel 1.3.6 Microsoft Excel 2007 or higher is not.. 
OO MysQL for Visual Studio 1.2.6 。 Visual Studio version 2010, 2012, 20.. 
© MysQL Utilities 1.64 Microsoft Visual C** 2013 Runtime.. 


© Connector/Ppython 34)2.1.4 。 Python 34is notinstalled 







































































he | ee | [ers 
7-11 ”检查 组 件 窗口 
一 本 

Installation 
Press Execute to upgrade the following products. 

Proguct Status Progress Notes 

RN] Wsat serer s717 Ready to Install 

加 wsar wortwercn ss Reaay to Inetall 

EE] wsa wanet7 Reaay to Inetall 

SN MysAL For Excel 135 Ready to Install 

区 wa vwes ts4 Ready to Instal 

了 | Connector/ODBC 535 Ready to Install 

本 Connector/C<= 1.17 Ready to Install 

Se] comeaom sn Reagy to Inetall 

站 ] ComectormET sse Ready to install 

园 comecorpyron B4214 Readyto Install 

园 wsa comecorc rs Ready to Inatall 

| wsat Documentation S717 Ready to Inatall 

E] smoesara pamples s717 Reagy to Install 
Chck [Execute] to install or update the following packages 

< Back Becute | | Cancel 
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等 待 安装 完成 后 ， 单 击 Next 按钮 ， 进 入 如 图 7-13 所 示 的 窗口 ， 对 MySQL Server 进行 
配置 。 


国 MysQL Installer 





or Installer Type and Networking 


rver 5.7.17 Server Configuration Type 
Choose the correct ser guration type for this MySQL Server installation, This setting will 
define how much syst: ces are assigned to the MySQL Server instance, 












Config Type: |EEE 




















Connectivity 
Use the following controls to select how you would like to connect to this server, 
Tep/lp Port Number |3306 
回 open Firewall port for network access 
Named Pipe Pipe Name: = MYSQL 
Shared Memory Memory Name = MYSQL 








Advanced Configuration 


Select the checkbox below to get additional configuration page where you can set advanced 
options for this server instance, 


Show Advanced Options 

















7-13 配置 MySQL Server 的 窗口 


用 户 可 视 需要 ， 选 择 下 面 三 种 服务 器 类 型 之 一 。 

Developer Machine: 开发 测试 类 型 ， 主 要 针对 个 人 使 用 ， 占 用 系统 资源 较 少 。 

Server Machine: 服务 器 类 型 ， 占 用 系统 资源 较 多 。 若 将 计算 机 作为 其 他 应 用 程序 的 服 
务 器 ， 如 FTP、E-mail、Web 服务 器 等 ， 则 可 以 将 数据 库 配 置 为 此 类 型 。 

Dedicated Machine: 专门 的 MySQL 数据 库 服务 器 ， 只 用 作 MySQL 服务 器 ， 不 运行 其 
他 程序 耗 用 系统 所 有 可 用 资源 。 

根据 需要 ， 在 本 节 中 ， 我 们 选择 Server Machine 进行 安装 ，MySQL 的 TCP 默认 端口 
为 3306， 如 果 仅 仅 是 本 地 软件 使 用 ， 不 需要 用 网 络 来 连接 MySQL 的 话 ， 也 是 可 以 不 选择 
的 。Named Pipe 是 局 域 网 用 的 协议 ， 如 果 需 要 可 以 勾 选 。Shared Memory 协议 是 仅 可 以 连 
接 到 同一 台 计 算 机 上 运行 的 SQL Server 实例 。 接 下 来 单 击 Next 按钮 ， 设 置 MySQL 数据 
库 管 理 员 用 户 root 的 密码 。 设 置 好 后 ， 单 击 打开 Windows Server 窗口 ， 如 图 7-14 所 示 ， 
设置 Windows 系统 服务 和 插件 扩展 的 选项 。 

至 此 ，MySQL 数据 库 的 安装 接近 完成 ， 单 击 Next 按钮 ， 接 下 来 就 是 一 些 检查 或 开启 
状态 窗口 ， 按 默认 单 击 Next 按钮 就 可 以 了 。 安 装 完成 后 ， 配 置 MySQL 环境 变量 ,将 
MySQL 的 安装 路 径 添加 到 环境 变量 的 PATH 变量 中 即 可 。 
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图 MysQL Installer 





MySQL. Installer Windows Service 
MysQ! 7.17 Configure MySQL Server as a Windows Service 


Windows Service Details 
Please specify a Windows Service name to be used for this MySQL Serverinstance A unique 
name is required for each instance 


Wedow sevice Name 


回 Start the MySQL Server at System Startup 


Run Windows Service as 
The MySQL Server needs to run under a given user account Based on the security 
requirements of your system you need to pick one of the options below. 


图 Standard System Account 
Recommended for most scenarios 


© Custom User 
An existing user account can be selected for advanced scenarios 


< Back Cancel 








7-14 ”Windows Server 窗口 


7.3.2 MySQL 数据 类 型 
在 MySQL 中 合理 定义 数据 字段 的 类 型 对 数据 库 的 优化 是 非常 重要 的 。MySQL 支持 多 
种 数据 类 型 ， 主 要 分 为 三 大 类 : 数值 类 型 、 字 符 串 (字符 ) 类 型 、 日 期 和 时 间 类 型 。 
1. 数值 类 型 
MySQL 支持 的 数值 数据 类 型 如 表 7-9 所 示 。 
表 7-9 数值 数据 类 型 





数据 类 型 说 明 
TINYINT 很 小 的 整数 值 ， 有 符号 的 范围 为 [-128，127]， 无 符号 的 范围 为 [0，255 
SMALLINT 小 整数 值 ， 有 符号 的 范围 为 [-32768，32767]， 无 符号 的 范围 为 [0，65535 
MEDIUMINT 中 等 大 小 的 整数 值 ， 有 符号 的 范围 为 [-8388608，8388607]， 无 符号 的 范围 为 [0， 


16777215] 
大 整数 值 ， 有 符号 的 范围 为 [-2147483648，2147483647]， 
无 符号 的 范围 为 [0，4294967295] 





INT 或 INTEGER 




















BIGINT 极 大 整数 值 ， 有 符号 的 范围 为 [-9233372036854775808， 
9223372036854775807]， 无 符号 的 范围 为 [0，18446744073709551615] 
FLOAT(M.D) 单 精度 浮 点 值 ， 其 中 M 表示 该 值 一 共 显示 M 位 整数 ，D 表示 其 中 D 位 位 于 小 数 


点 后 面 
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续 表 
数据 类 型 说 明 
TINYINT 很 小 的 整数 值 ， 有 符号 的 范围 为 [-128，127]， 无 符号 的 范围 为 [0，255] 
SMALLINT 小 整数 值 ， 有 符号 的 范围 为 [-32768，32767]， 无 符号 的 范围 为 [0，65535] 
MEDIUMINT 中 等 大 小 的 整数 值 ， 有 符号 的 范围 为 [-8388608，8388607]， 





无 符号 的 范围 为 [0，16777215] 





INT 或 INTEGER | 大 整数 值 ， 有 符号 的 范围 为 [-2147483648，2147483647]， 


无 符号 的 范围 为 [0，4294967295] 























BIGINT 极 大 整数 值 ， 有 符号 的 范围 为 [-9233372036854775808， 
9223372036854775807]， 无 符号 的 范围 为 [0，18446744073709551615] 

FLOAT(MD) 单 精 度 浮 点 值 ， 其 中 M 表示 该 值 一 共 显 示 M 位 整数 ，D 表示 其 中 D 位 位 于 小 数 
点 后 面 

DOUBLE(M.D) 双 精 度 浮 点 值 ， 其 中 M 表示 该 值 一 共 显示 M 位 整数 ，D 表示 其 中 D 位 位 于 小 数 
点 后 面 

DECIMAL(M,D) | 定点 数 ， 其 中 M 表示 十 进 制 数字 总 的 个 数 ，D 表示 小 数 点 后 面 数字 的 位 数 ，M 
的 默认 取 值 为 10，D 默认 取 值 为 0 

BIT(M 位 字段 值 ， 允 许 存 储 M 位 值 ，M 范围 为 [1,64]， 默 认为 1 

2. 字符 串 类 型 


MySQL 支持 的 字符 串 数 据 类 型 如 表 7-10 所 示 。 
表 7-10 ”字符 串 数据 类 型 














数据 类 型 说 明 

CHAR(N) 固定 长 度 的 字符 串 ，N 为 存储 长 度 

VARCHAR(N) | 可 变 长 度 的 字符 串 ，N 为 最 大 存储 长 度 

es 类 似 于 CHAR 类 型 ， 但 不 同 的 是 BINARY 存储 的 是 二 进 制 字 节 字符 串 ， 
N 为 存储 长 度 

VARCHAROD 类 似 于 VARCHAR 类 型 ， 但 不 同 的 是 VARCHAR 存储 的 是 二 进 制 字 节 字符 串 ， 
对 为 存储 长 度 
二 进 制 大 对 象 ， 可 以 容纳 可 变数 量 的 数据 。 包 括 TINYBLOB、BLOB、 

BLOB MEDIUMBLOB 和 LONGBLOB 种 类 型 ， 这 4 种 类 型 可 容纳 值 的 最 大 长 度 不 同 
大 文本 类 型 ， 有 4 种 TEXT 类 型 ， 即 TINYTEXT、TEXT、MEDIUMTEXT 和 

Se LONGTEXT， 对 应 4 种 BLOB 类 型 

SET 集合 类 型 
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3. 日 期 和 时 间 类 型 
MySQL 支持 的 日 期 和 时 间 数 据 类 型 如 表 7-11 所 示 。 
表 7-11 “日 期 和 时 间 数 据 类 型 











数据 类 型 说 明 
DATE 日 期 值 ， 例 如 2017-04-06 
TIME 时 间 值 ， 例 如 14:20:30 
YEAR 年 份 值 ， 默 认为 四 位 年 份 值 
DATETIME 日 期 和 时 间 ， 例 如 2017-04-06 14:20:30 





时 间 戳 ， 自 动 存储 记录 修改 的 时 间 ， 
用 于 INSERT 或 UPDATE 操作 时 记录 日 期 和 时 间 





TIMESTAMP 


7.3.3 ”MySQL 的 基本 操作 


1. 登录 到 MySQL 

首先 启动 MySQL 服务 ， 当 MySQL 服务 已 经 运行 时 ， 打 开 Windows 命令 提示 符 窗口 
输入 以 下 格式 的 命令 : 

mysql -h 主机 名 - u 用 户 名 -p ( 若 登 录 当 前 计算 机 ， 则 “-h 主机 名 ”可 以 省 略 ) 

例如 ， 在 命令 行 下 输入 如 下 命令 并 回 车 : 

mysql -u root -p 

会 有 Enter password 提示 ， 此 时 应 输入 密码 ， 若 密码 正确 ， 则 可 以 看 到 如 图 7-15 所 示 
的 提示 。 


国 命令 提示 符 - mysql -u root -p —- 口 > 








图 7-15 登录 MySQL 
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2. 创建 数据 库 

使 用 CREATE DATABASE 语句 来 完成 数据 库 的 创建 ， 语 句 格 式 如 下 : 

CREATE DATABASE IF NOT EXISTS 数据 库 名 ; 

若 使 用 关键 字 正 NOT EXISTS， 当 指定 的 数据 库存 在 时 ， 不 创建 数据 库 。 若 不 使 用 关 


键 字 正 NOT EXISTS， 并 且 指 定 的 数据 库存 在 ， 将 产生 错误 。 
【 例 7-11】 创 建 数 据 库 Test_db: 


CREATE DATABASE IF NOT EXISTS Test db; 

3. 删除 数据 库 

使 用 DROP DATABASE 语句 可 以 删除 数据 库 ， 基 本 语法 格式 如 下 : 
DROP DATABASE 数据 库 名 ; 

使 用 SHOW DATABASES 语句 可 显示 所 有 数据 库 。 

4. 创建 数据 库 表 

使 用 CREATE TABLE 语句 创建 数据 库 表 ， 基 本 语法 格式 如 下 : 


CREATE TABLE 表 名 

( 
列 名 1 数据 类 型 字段 属性 ， 
列 名 2 数据 类 型 字段 属性 ， 


列 名 n 数据 类 型 字段 属性 
Ee 
常用 的 字段 属性 如 表 7-12 所 示 。 
表 7-12 常用 的 字段 属性 
字段 属性 
PRIMARY KEY 


AUTO INCREMENT 
INDEX 


描 述 
设置 指定 列 为 主键 ， 用 于 确保 记录 的 唯一 性 
设置 指定 列 为 自动 增加 列 ， 每 个 新 插入 的 记录 赋值 为 上 一 次 插入 的 ID+1 
为 指定 列 创建 索引 ， 加 速 数 据 库 查询 























NOTNULL 设置 指定 列 的 值 不 允许 为 空 

NULL 设置 指定 列 的 值 允 许 为 空 

DEFAULT 设置 指定 列 的 默认 值 

UNIQUE 设置 指定 列 所 有 值 除 NULL 外 都 不 相同 
BINARY 设置 指定 列 以 区 分 大 小 写 方式 排序 





【 例 7-12】 使 用 CREATE TABLE 语句 创建 教师 信息 表 Teacher， 表 Teacher 的 结构 如 
表 7-13 所 示 。 
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表 7-13 表 Teacher 的 结构 














字段 名 字段 属性 
TNo 主键 ， 自 动 递增 列 
TName VARCHAR(50) 不 允许 为 空 
TSex CHARCO) 默认 值 为 “ 男 ” 
TAge INT 不 允许 为 空 
TTitle VARCHAR(50) 不 允许 为 空 
TDe a 学 院 VARCHAR(50) 不 允许 为 空 


CREATE TABLE Teacher ( 





TNO INT AUTO INCREMENT PRIMARY KEY, 
TName VARCHAR(50) NOT NULL, 
TSex CHAR(2) DEFAULT' 男 '，, 


TAge INT NOT NULL, 


TTitle VARCHAR(50) NOT NULL, 
TDe VARCHAR(50) NOT NULL 


i 


执行 此 命令 前 
号 ， 它 的 基本 语法 格式 为 : 
USE 要 操作 的 数据 库 名 


5. 修改 表 结 构 





前 可 以 使 用 USE 语句 选择 一 个 所 要 操作 的 数据 库 ，USE 语句 可 以 不 加 分 


使 用 ALTER TABLE 语句 修改 表 结 构 。 

(1) 向 表 中 添加 列 ， 其 基本 语法 格式 为 : 

ALTER TABLE 表 名 ADD 列 名 数据 类 型 列 属性 ; 

【 例 7-13】 使 用 ALTER TABLE 语句 在 表 Teacher 中 增加 所 属 学 院 编号 列 ， 列 名 为 
DNo， 数 据 类 型 为 INT， 列 属性 为 “不 允许 为 空 ”: 

ALTER TABLE Teacher ADD DNO INT NOT NULL; 

(2) 修改 列 属性 ， 其 基本 语法 格式 为 : 

ALTER TABLE 表 名 MODIFY 列 名 新 数据 类 型 新 列 属性 ; 

【 例 7-14】 使 用 ALTER TABLE 语句 在 表 Teacher 中 修改 DNo 列 ， 将 数据 类 型 修改 为 
CHAR(5)， 列 属性 为 “允许 为 空 ”: 

ALTER TABLE Teacher MODIFY DNo CHAR(5) NULL; 

(3) 删除 列 ， 其 基本 语法 格式 为 : 


ALTER TABLE 表 名 DROP COLUMN 列 名 ; 
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【 例 7-15】 删 除 表 Teacher 中 的 DNo 列 ， 有 具体 命令 如 下 : 


ALTER TABLE Teacher DROP COLUMN DNo; 


6. 删除 表 
使 用 DROP TABLE 语句 删除 数据 库 中 的 表 ， 其 基本 语法 格式 为 : 


DROP TABLE 表 名 ; 


7. 插入 数据 
使 用 INSERT 语句 向 表 内 插入 数据 ， 语 法 格式 为 ( 列 与 值 必须 一 一 对 应 ): 
INSERT INTO 表 名 ( 列 名 1， 列 名 2, ..., 列 名 n) 
VALUES ( 值 1, 值 2, ..., 值 n); 
【 例 7-16】 使 用 INSERT 语句 参照 表 7-14 向 表 Teacher 中 插入 数据 (由 于 设置 了 字段 
TNo 为 AUTO_INCREMENT 属性 ， 在 这 并 不 需要 指定 字段 TNo 的 值 )。 


表 7-14 表 Teacher 中 插入 的 数据 


TName TDe 
教授 计算 机 科学 与 软件 学 院 

| 男 |4 | 副教授 | 纺织 学 院 

赵亮 男 纺织 学 院 

张 训 37 管理 学 院 

王 丽 计算 机 科学 与 软件 学 院 

张 阳 | ss。 | 孝明 ”| 经济 学 院 


命令 如 下 : 


INSERT INTO Teacher (TName,TSex,TAge,TTitle,TDe) VALUES (' 李 丽 ', ' 女 ',55, 
"教授 '，' 计算 机 科学 与 软件 学 院 ') ; 

INSERT INTO Teacher (TName,TAge,TTitle,TDe) VALUES (' 王 阳 ', 40,' 副 教授 '， 
' 纺 织 学 院 ') ; 

INSERT INTO Teacher (TName,TAge,TTitle,TDe) VALUES (' 赵 亮 ', 35,' 讲 师 '， 

!' 纺 织 学 院 ') ; 

INSERT INTO Teacher (TName,TAge,TTitle,TDe) VALUES (' 张 亮 ', 37, ' 副 教授 '， 

' 管 理学 院 ') ; 

INSERT INTO Teacher (TName,TSex,TAge,TTitle,TDe) VALUES (' 王 丽 ', ' 女 ', 43, 
' 讲 师 ',' 计 算 机 科学 与 软件 学 院 ') ; 

INSERT INTO Teacher (TName,TSex,TAge,TTitle,TDe) VALUES (' 张 阳 ', ' 女 ', 48, 
' 教 授 ',' 经 济 学 院 ') ; 


在 可 视 化 工具 MySQL Workbench 中 可 以 直观 地 看 到 例 7-16 使 用 INSERT 语句 所 创建 
的 表 Teacher， 如 图 7-16 所 示 。 
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图 7-16 例 7-16 所 创建 的 表 Teacher 


8. 修改 数据 
使 用 UPDATE 语句 修改 表 中 的 数据 ， 语 句 的 一 般 格式 为 : 


UPDATE 表 名 SET 列 名 1= 值 1， 列 名 2= 值 2，..., 列 名 n= 值 n 
WHERE 修改 条 件 表达 式 ; 


该 语句 的 功能 是 修改 表 中 满足 WHERE 子 句 条 件 的 记录 。 其 中 SET 子 句 用 于 指定 修改 
方法 ， 即 列 1 的 值 被 设置 为 值 1， 列 2 的 值 被 设置 为 值 2， 列 n 的 值 被 设置 为 值 n。 如 果 省 
略 WHERE 子 句 ， 则 表 中 所 有 的 记录 都 将 被 修改 。 

【 例 7-17】 使 用 UPDATE 语句 修改 表 Teacher， 将 赵亮 的 年 龄 改 为 34: 


UPDATE Teacher SET TAge=34 WHERE TName = ' 赵 亮 '; 


9. 删除 数据 

使 用 DELETE 语句 删除 表 中 的 数据 ， 语 法 格式 如 下 : 

DELETE FROM 表 名 WHERE 删除 条 件 表达 式 ; 

DELETE 语句 的 功能 是 将 指定 表 中 满足 WHERE 子 句 条 件 的 所 有 记录 删除 。 如 果 没 有 
提供 WHERE 子 句 ， 则 DELETE 语句 将 删除 表 中 的 所 有 记录 ， 但 表 的 结构 仍 在 ， 也 就 是 
说 ，DELETE 语句 删除 的 是 表 中 的 数据 。 

10. 使 用 SELECT 语句 查询 数据 

(1) 查询 指定 列 。 

语句 的 一 般 格式 为 : 

SELECT 列 名 1， 列 名 2，...， 列 名 n FROM 表 名 ; 

若 查询 全 部 列 ， 可 用 “*” 代 替 “ 列 名 1, 列 名 2, ..., 列 名 n”。 如 下 面 的 例子 。 

【 例 7-18】 查 询 表 Teacher 中 的 所 有 信息 : 

SELECT * FROM Teacher; 

查询 结果 如 图 7-17 所 示 。 

(2) 给 列 指定 别名 。 

有 两 种 格式 : 列 名 别名 ; 列 名 AS 别名 。 如 下 面 的 例子 。 

【 例 7-19】 查 询 表 Teacher 中 的 TName、TTitle， 要 求 显示 中 文 列 名 : 


SELECT TName ' 姓 名 '，TTitle ' 职 称 ' FROM Teacher; 
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或 者 : 
SELECT TName AS ' 姓 名 '，TTitle RS ' 职 称 ' FROM Teacher; 


查询 结果 如 图 7-18 所 示 。 





图 7-17 例 7-18 的 查询 结果 图 7-18 例 7-19 的 查询 结果 
(3) 消除 取 值 重复 行 。 
使 用 关键 字 DISTINCT 可 消除 取 值 重复 的 行 。 如 下 面 的 例子 。 
【 例 7-20】 查 询 所 有 教师 的 职称 情况 : 
SELECT DISTINCT TTitle FROM Teacher; 


查询 结果 如 图 7-19 所 示 。 





图 7-19 例 7-20 的 查询 结果 
(4) 设置 查询 条 件 。 
WHERE 子 句 可 以 指定 返回 结果 的 查询 条 件 。 
WHERE 子 句 中 常用 的 查询 条 件 如 表 7-15 所 示 。 
表 7-15 WHERE 子 句 常用 的 查询 条 件 





























查询 条 件 谓词 描 述 
= 等 于 ， 例 如 TAge=40 
> 大 于 ， 例 如 TAge>2 
< 小 于 ， 例 如 TAge<2 

本 > 大 于 等 于 ， 例 如 TAge>=2 

小 于 等 于 ， 例 如 TAge<-2 
上 = 或 二 不 等 于 ， 例 如 TAge!=-2 或 TAge<>2 
> 不 大 于 ， 例 如 TAge!>2 
!< 不 小 于 ， 例 如 TAge!<2 
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BETWEEN AND 判断 指定 列 的 属性 值 是 否 在 指定 范围 内 ， 
例如 TAge BETWEEN 30 AND 50 
确定 范围 i i 
NOT BETWEEN AND ”| 判断 指定 列 的 属性 值 是 否 不 在 指定 范围 内 ， 
例如 TAge NOT BETWEEN 30AND 50 
IN 判断 指定 列 的 属性 值 是 否 属于 指定 集合 ， 
确定 集合 例 多 TAge IN(30,37.45,55) - 
NOTIN 判断 指定 列 的 属性 值 是 否 不 属于 指定 集合 ， 
例如 TAge NOT IN(30,37,45,55) 
LIKE 判断 指定 列 的 属性 值 是 否 与 匹配 字符 串 相 匹 配 ， 匹 配 字符 串 
可 以 是 一 个 完整 的 字符 串 ， 也 可 含有 通配符 % 和 _(% 代 表 任 
本 罗 意 长 度 的 字符 串 ，_ 代 表 任 意 单个 字符 )， 例 如 TName LIKE 
字符 匹配 ee 
NOT LIKE 判断 指定 列 的 属性 值 是 否 与 匹配 字符 串 不 相 匹配 ， 例 如 
TName NOT LIKE “ 张 %* 
ee IS NULL 判断 指定 列 的 属性 值 是 否 为 空 ， 例 如 TAge IS NULL 
Is NOT NULL 判断 指定 列 的 属性 值 是 否 不 为 空 ， 例 如 TAgeIS NOT NULL 
AND(&& 逻辑 与 ， 查 询 满 足 所 有 条 件 的 记录 
OR 逻辑 或 ， 查 询 满 足 任 一 条 件 的 记录 
NOT(! 逻辑 非 ， 查 询 不 满足 表达 式 的 记录 








(5) 对 查询 结果 进行 排序 。 


通过 在 SELECT 语句 中 使 用 ORDER BY 子 句 ， 可 以 根据 指定 列 对 查询 结果 进行 排 


序 。ORDER BY 子 句 默认 的 排序 顺 
项 。 如 下 面 的 例子 。 





序 为 升序 (ASC)， 若 要 按 降 序 排序 ， 必 须 指 明 DESC 选 


【 例 7-21】 查 询 表 Teacher 中 全 体 男 教师 的 信息 ， 要 求 查询 结果 按照 年 龄 降序 排列 : 


SELECT * FROM Teacher WHERE TSex=' 男 ' ORDER BY TAge DESC; 


查询 结果 如 图 7-20 所 示 。 





7-20 例 7-21 的 查询 结果 
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(6) 使 用 统计 函数 。 


在 SELECT 语句 中 使 用 统计 函数 ， 可 以 对 指定 列 进行 统计 。MySQL 中 常用 的 统计 函 
数 主要 有 以 下 5 种 。 

@ MAX0: 统计 指定 列 的 最 大 值 。 

@ MIN0O: 统计 指定 列 的 最 小 值 。 

@ SUN0: 统计 指定 列 的 总 和 。 

@ AVG0: 统计 指定 列 的 平均 值 。 

回 COUNTO: 统计 记录 个 数 。 

当 聚 集 函 数 遇 到 空 值 时 ， 除 了 COUNT(*) 外 ， 其 他 的 函数 都 会 忽略 空 值 ， 只 处 理 非 空 
值 。 如 果 在 统计 函数 中 使 用 关键 字 DISTINCT， 则 表示 在 统计 时 先 消除 指定 列 取 重复 值 的 
记录 ， 然 后 再 进行 统计 ; 如 果 不 指 定 关键 字 DISTINCT 或 指定 关键 字 ALL(ALL 为 默认 
值 )， 则 表示 不 取消 指定 列 重复 值 的 记录 。 

【 例 7-22】 统 计 表 Teacher 中 所 有 教师 的 平均 年 龄 : 

SELECT AVG (TAge) FROM Teacher; 

为 了 便于 理解 ， 可 以 对 统计 列 取 列 名 ,语句 修改 如 下 : 

SELECT AVG (TAge) ' 平 均 年 龄 ' FROM Teacher; 


统计 结果 如 图 7-21 所 示 。 












































图 7-21 例 7-22 的 查询 结果 


(7) 分 组 统计 。 

在 SELECT 语句 中 使 用 GROUP BY 子 句 ， 可 用 来 对 查询 结果 进行 分 组 ， 并 对 每 组 数 
据 进 行 汇总 统计 。 

在 SELECT 语句 中 使 用 GROUP BY 子 句 ，SELECT 子 句 中 只 能 出 现 分 组 列 的 列 名 和 
统计 函数 。 如 下 面 的 例子 。 

【 例 7-23】 统 计 表 Teacher 中 各 职称 教师 的 人 数 : 


SELECT TTitle，COUNT (*) ' 人 数 ' FROM Teacher GROUP BY TTitle; 


统计 结果 如 图 7-22 所 示 。 
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图 7-22 例 7-23 的 查询 结果 


若 分 组 后 要 按 一 定 条 件 对 这 些 组 进行 筛选 ， 最 终 只 输出 满足 指定 条 件 的 组 ， 则 使 用 
HAVING 子 句 指定 筛选 条 件 。HAVING 子 句 与 WHERE 子 句 作用 类 似 ， 但 HAVING 子 名 
只 能 用 于 GROUP BY 子 句 ，WHERE 是 用 于 在 初始 表 中 筛选 查询 ，HAVING 子 句 中 可 以 
使 用 聚集 函数 ， 而 WHERE 则 不 能 。 

【 例 7-24】 将 表 Teacher 中 的 所 有 男 教师 按 职 称 分 组 ， 统 计 每 组 教师 的 平均 年 龄 : 

SELECT TTitle，AVG (TAge) ' 平 均 年 龄 ' FROM Teacher WHERE TSex=' 男 ' GROUP BY 

TTitle; 


统计 结果 如 图 7-23 所 示 。 





图 7-23 例 7-24 的 查询 结果 


【 例 7-2S】 将 表 Teacher 中 的 教师 按 职称 分 组 ， 统 计 平 均 年 龄 大 于 40 岁 的 教师 的 职称 
类 型 了 


SELECT TTitle，RAVG(TRAge) ' 平 均 年 龄 ' FROM Teacher GROUP BY TTitle HAVING 
AVG (TAge) >40; 


统计 结果 如 图 7-24 所 示 。 





图 7-24 例 7-25 的 查询 结果 





7.3.4 使 用 Python 操作 MySQL 数据 库 


(1) 使 用 Python 操作 MySQL 数据库， 需要 安装 pymysql 模块 ， 它 是 Python 操作 
MySQL 必 不 可 少 的 模块 。 安 装 步骤 如 下 。 
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GD 在 Python 官网 上 下 载 管理 包工 具 ez_setuppy。 下 载 地 址 为 http://pypi.python.org 
/pypiez_setup/。 

@@ 打开 DOS 命令 提示 符 窗口 ， 切 换 到 Python 目录 下 运行 下 面 的 命令 ， 安 装 
easy_install.exe 工具 包 : 








Python ez setup.py 

@@ 安装 完成 后 ， 可 在 Python 目录 下 的 Scripts 目录 中 看 到 easy_install.exe。 打 开 
DOS 命令 提示 符 窗口 ， 切 换 到 Python 的 Scripts 目录 下 运行 下 面 的 命令 ， 安 装 pymysql: 

easy_install pymysql 

(2) 安装 好 pymysql 后 ， 就 可 以 用 Python 来 操作 MySQL 数据 库 了 ， 下 面 介绍 具体 的 
操作 步骤 。 

@@ 导入 pymysql 模块 。 

执行 下 面 的 语句 将 导入 pymysql 模块 : 

import pymysql 

@ ”连接 数据 库 。 

使 用 connect() 方 法 建立 数据 库 的 连接 ， 里 面 可 以 指定 参数 : 用 户 名 ， 密 码 ， 主 机 等 信 
息 ， 语 法 格式 如 下 : 

数据 库 连接 对 象 = pymsql .connect (数据 库 服务 器 ,用 户 名 , 密码 , 数据 库 名 ) 

图 创建 游标 。 

要 操作 数据 库 ， 需 要 通过 cursor() 方 法 来 创建 游标 。 语 法 格式 如 下 : 

游标 对 象 = 数据 库 连 接 对 象 .cursor () 

@ 执行 SQL 语句 。 

通过 游标 对 象 操作 execute() 方 法 可 以 执行 SQL 语句 ， 返 回 值 为 受 影响 的 行 数 。 语 法 格 
式 如 下 : 

游标 对 象 .execute (SQL 语句 ) 

@ ”使 用 游标 查询 数据 。 

使 用 游标 对 象 的 execute() 方 法 执行 SELECT 语句 ， 可 将 查询 结果 保存 在 游标 中 ， 语 法 
格式 如 下 : 

游标 对 象 .execute (SELECT 语句 ) 

使 用 游标 对 象 的 fetchall0 方 法 获取 游标 中 所 有 的 数据 ， 并 放 到 一 个 元 组 中 ， 语 法 格式 
如 下 : 

结果 集 元 组 = 游标 对 象 .fetchall () 

【 例 7-26】 在 数据 库 test_db 中 使 用 游标 查询 表 Teacher 中 的 数据 : 


import pymysql 
co=pymysql .connect ("localhost", "root", "1234", "test db",charset="utf8") 
Cx=CO.cursor() 
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个 菜单 程序 作为 调用 接口 ， 


CX-.-execute ("SELECT * FROM Teacher") 
a=cx.fetchall () 

print (a) 

cx.close() 

co.close() 


运行 结果 如 下 : 
(1 “ 李 丽 : ，“ 女 "，55, “教授 ， alert )， (2 7" 王 阳 " ,“ 男 ，4 
副教授 '， 纺 级 学院" )， (3，? 赵 高 ， 男 ， “讲师 纺织 学 院 )， (4，” 张 高 ”， 
;37, “副教授 管理 学 院 ”)，(5 ?于 而 * 女 "，43, “讲师 ", “计算 机 科学 与 
软件 学 院 ” )，(6,“ 张 阳 `,“ 女 " ，48, “教授 , “经 济 学 院 " )) 


@ 数据 库 的 提交 : 
数据 库 连 接 对 象 . commit () 


用 于 提交 对 数据 库 的 修改 ， 将 数据 保存 到 数据 库 中 。 
@ 关闭 数据 库 连接 。 

关闭 游标 对 象 : 

游标 对 象 .close () 

数据 库 连 接 对 象 .close () 


7.4 案例 实 训 : 管理 信息 系统 的 数据 操作 


本 案例 程序 集 数据 的 增 、 删 、 改 、 查 于 一 体 ， 类 似 于 规模 很 小 的 管理 信息 


能 。 本 案例 程序 如 下 : 
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import pymysql 


co=pymysql .connect ("localhost", "root", "1234","test db",charset="utf8") 


Cx=CO.cursor () 
def insert info() : #3 插入 数据 
Cx=CO.cursor() 
PSNo=input ("请 输入 学 生 学 号 : ") 
cx.execute ("select SNO from student where SNo='%s'"% PSNo) 
row=cx.fetchone() 
二 下 GOWL 
print (" 该 学 号 已 存在 ， 请 重新 输入 : ") 
else: 
pSName=input (" 请 输入 学 生 姓 名 : ") 
psclass=input (" 请 输入 学 生 班 级 : ") 
cx.execute ("insert into student (SNo, SName,SClass) 
values('%s','%s','%Ss')"% (pSNo,pSName,psClass)) 
co.commit () 
print ("学 生 信息 录入 完毕 。") 
co.commit () 
cx.close() 





以 选择 执行 某 一 个 功能 ， 选 择 后 调用 相应 的 程序 完成 相应 的 功 
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def search info() : 查询 数据 
CX=Co.CUrsor () 
pSNo= input ("请 输入 学 生 学 号 :") 
CX.execute ( 
"SELECT SNo, SName,SC1ass from Student where SNo='%s'"% PSNo) 
row = cx.fetchone() 
if row: 
print ("您 所 查询 的 学 生 信息 为 :") 
print ("学 号 :", row[0]) 
print ("姓名 :", row[1]) 
print ("班级 :", row[2]),"\n" 
Elses 
print (" 没 有 查询 该 学 号 的 学 生 信息 ! ") 
cx.close() 
def update info() : # 修 改 数据 
CX=Co.cursor () 
PSNo=input (" 请 和 输入 学 生 学 号 :") 
CX.execute ("SELECT SNO from student where SNo='%s'"$% PSNo) 
row = cx.fetchone() 
if row: 
colums=input ("请 输入 修改 的 列 名 (SNo, SName, SClass) :") 
value=input ("请 输入 新 值 :") 
CX.execute ( 
"update student set $%s='%s' Where SNo ='%s'"$ (colums,value,pSNo)) 
print ("修改 完毕 ! ") 
elses 
print ("该 学 号 不 存在 ,请 重新 输入 ") 
co.commit () 
cx.close() 
def delete info() :  # 删 除数 据 
CX=Co .cuUrsor () 
pSNo=input (" 请 输入 学 生 学 号 :") 
CX.execute ("SELECT SNO from Student where SNo = '%s'"% PSNo) 
row = cx.fetchone() 


if row: 
cx.execute ("delete from student where SNo = '%s'"% PSNo) 
print ("删除 完毕 ! ") 

SSes 


print ("该 学 号 不 存在 , 请 重新 输入 ") 
co -commit () 
cx.close() 
def menu(): # 菜 单 目 录 
print ("1 .信息 录入 ") 
print ("2. 信 息 删 除 ") 
print ("3. 信 息 修改 ") 
print ("4 .信息 查询 ") 
print ("5. 退 出 ! ") 
def main(): # 菜 单 目 录 选 择 


while True: 


menu () 
x=input (" 输 入 您 所 选择 的 菜单 号 : ") 
print 

FX == 
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insert info() 
continue 
Eh 
delete info() 
continue 
Es 
update info() 
continue 
if x =="'4"': 
search info() 
continue 
Ph 250 
print ("欢迎 再 次 使 用 本 系统 ! 谢谢 ! ") 
exit () 
else: 
print ("输入 的 选项 不 存在 ， 请 重新 输入 ! ") 


continue 





main() 


本 程序 的 添加 、 删 除 、 修 改 、 查 询 信 息 功能 的 运行 结果 如 图 7-25 ~ 7-28 所 示 。 





图 7-25 添加 信息 功能 图 7-26 删除 信息 功能 








图 7-27 修改 信息 功能 图 7-28 查询 信息 功能 
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本 章 小 结 


Python 支持 多 种 数据 库 ， 其 中 包括 SQLite 数据 库 和 MySQL 数据 库 。 本 章 简要 介绍 了 
数据 库 的 一 些 基本 概念 和 两 种 关系 型 数据 库 一 SQLite 数据 库 与 MySQL 数据 库 的 基本 使 
用 操作 ， 以 及 如 何 通过 sqlite3 模块 和 pymsql 模块 分 别 操作 这 两 种 数据 库 。 事 实 上 ， 
Python 标准 数据 库 接口 为 Python DB-API， 它 支持 多 种 数据 库 ， 不 同 的 数据 库 需 要 不 同 的 
DB-API 模块 ， 因 篇 幅 所 限 ， 本 章 没 有 介绍 。 

习 题 

1. 填空 题 

(1) 根据 数据 存储 模型 ， 可 将 数据 库 分 为 ( 和 和 )、 面 向 对 象 数 
据 库 等 ，SQLite 数据 库 和 MySQL 数据 库 都 属于 ( ) 数 据 库 。 

(2) SQLite 数据 库 中 ， 字 段 属性 PRIMARY KEY 用 来 设置 指定 字段 为 ( )， 以 确 
保 记 录 的 ( » 

(3) 使 用 SELECT 语句 查询 数据 时 ， 可 以 使 用 关键 字 ( ) 来 消除 取 值 重复 行 。 

(4) Python 连接 MySQL 数据 库 时 需要 单独 下 载 ( ) 模 块 ， 并 执行 语句 ( ) 来 
导入 该 模块 。 

(5) HAVING 子 名 与 WHERE 子 名 作用 类 似 ， 都 是 指定 筛选 条 件 ， 但 HAVING 子 句 
只 能 用 于 ( ) 子 句 ，WHERE 是 用 于 在 初始 表 中 筛选 查询 ; HAVING 子 句 中 可 以 使 用 
)， 而 WHERE 则 不 能 。 

2. 选择 题 

(1) 数据 库 是 长 期 存储 在 计算 机 内 、 有 组 织 、 统 一 管理 的 相关 (  )。 

A. 文件 的 集合 ” B. 数据 的 集合 ”C. 数值 的 集合 ”DD. 程序 的 集合 

(2) 下 列 哪些 是 关系 型 数据 库 ? 

© Redis ® DB2 ©® MySQL @ MongoDB © Oracle © HBase 

A. OOO B. OO@ C. DOO D. DO© 
(3) 下 列 属于 MySQL 的 日 期 和 时 间 数 据 类 型 的 是 (  )。 
O INT ® DATE ©® INYINT @ TIMESTAMP @ YEAR @ BIT 


A. DO© B. OOO C. OOO D. DO© 
(4) 下 列 哪 种 方法 可 以 提交 事务 ? 

A. execute() B. fetchallO C. connect() D. commit() 
(5) 使 用 下 面 哪个 语句 可 以 更 新 数据 ? 

A. CREAT B. UPDATE C.DELETE D. INSERT INTO 
3. 问答 题 


(1) 什么 是 数据 库 、 数 据 库 管理 系统 和 数据 库 系 统 ? 简 述 三 者 的 不 同 之 处 。 
(2) 简单 介绍 SQLite 数据 库 以 及 sqlite3 模块 提供 的 数据 库 访问 方法 。 
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4. 实验 操作 题 


参照 本 章 7.2.5 小 节 的 示例 ， 用 Python 操作 SQLite 数据 库 ， 实 现 以 下 任务 。 

(1) 创建 数据 库 和 表 ， 数 据 库 名 为 mydatabase， 表 名 为 user， 表 中 包含 三 列 : id、 
name 和 tel， 其 中 id 为 主键 ，name 不 允许 为 空 。 

(2) 编写 对 表 user 中 的 数据 进行 插入 、 修 改 和 删除 的 程序 。 

(3) 查询 表 中 数据 。 
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本 章 要 点 

(1) Web 应 用 的 工作 方式 。 

(2) MVC 设计 模式 。 

(3) CGI 通用 网 关 接 口 。 

(4) 使 用 模板 快速 生成 Web 页 面 。 

学 习 目 标 

(1) 掌握 Web 应 用 的 基本 工作 方式 。 

(2) 掌握 MVC 设计 模式 的 具体 内 容 。 

(3) 了 解 CGI 的 相关 知识 。 

(4) 掌握 使 用 Python 建立 Web 服务 器 的 方法 。 
(5) 掌握 使 用 模板 快速 生成 HTML 页 面 的 方法 。 


Python 语言 得 益 于 其 强大 的 标准 库 和 第 三 方 库 的 支持 ， 使 其 可 以 很 好 地 应 用 于 Web 
软件 开发 。 同 时 ， 由 于 它 可 以 很 好 地 支持 最 新 的 XML 技术 并 和 多 种 语言 结合 使 用 ， 也 使 
其 在 Web 开发 方向 的 应 用 越 来 越 广泛 。 本 章 将 主要 介绍 如 何 使 用 Python 进行 Web 开发 。 


8.1 将 程序 放 在 Web 上 运 


顺利 地 学 习 了 前 面 的 知识 ， 相 信 读 者 已 经 能 够 使 用 Python 语言 编写 一 些 简单 的 代码 ， 
用 以 解决 工作 或 学 习 中 遇 到 的 问题 了 。 试 想 ， 如 果 编写 了 一 个 得 意 的 小 工具 ， 如 何 能 让 更 
多 的 人 一 起 来 分 享 这 种 方便 呢 ? 当 对 它 进 行 功能 升级 后 ， 如 何 让 所 有 使 用 它 的 用 户 都 可 以 
马上 体验 到 最 新 的 版 本 ? 如 何 让 输入 输出 有 更 好 的 用 户 体验 ? 

使 用 Python 语言 的 Web 开发 功能 ， 将 开发 的 程序 放 在 Web 服务 器 上 运行 ， 可 以 很 好 
地 解决 上 述 问题 。 而 且 相 对 于 代码 裸露 的 单机 版 本 ， 一 个 基于 Web 的 应 用 会 有 如 下 的 众多 
优点 。 

(1) 轻松 访问 ， 可 以 随时 随地 地 通过 浏览 器 访问 你 的 应 用 。 

(2) 跨 平台 访问 ， 可 以 通过 多 种 媒体 工具 访问 你 的 应 用 ， 使 你 的 应 用 不 只 是 运行 在 单 
一 的 设备 上 。 

(3) 增加 用 户 ， 可 以 让 更 多 的 人 方便 地 使 用 你 的 应 用 ， 同 时 更 好 地 了 解 用 户 的 需求 。 

(4) 同步 更 新 ， 可 以 让 所 有 人 即刻 用 到 最 新 的 版 本 。 

(5) 良好 的 界面 ， 运 用 Web 技术 为 程序 编写 一 个 舒服 的 界面 ， 让 代码 不 再 枯燥 。 


8.1.1 Web 应 用 的 工作 方式 


在 学 习 编写 一 个 Web 应 用 之 前 ， 需 要 了 解 一 下 Web 应 用 是 如 何在 服务 器 上 工作 的 。 

不 论 我 们 在 Web 上 进行 什么 操作 ， 都 会 用 到 请 求 和 响应 。 首 先是 用 户 通 过 Web 浏览 
器 发 送 一 个 包含 交互 操作 (输入 一 个 URL、 选 择 一 个 链接 或 者 提交 一 个 表单 ) 的 Web 请 求 到 
Web 服务 器 上 。Web 服务 器 会 根据 请 求 的 报 文 信息 将 需要 的 HTML、CSS、JS 等 文件 生成 
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一 个 Web 响应 ， 并 发 回 给 Web 浏览 器 。 整 个 过 程 大 致 分 为 4 个 阶段 。 

(1) 用 户 从 Web 浏览 器 输入 一 个 URL、 选 择 一 个 链接 或 者 提交 一 个 表单 。 

(2) Web 浏览 器 将 用 户 的 操作 转换 为 一 个 Web 请 求 ， 并 通过 网 络 通信 将 这 个 请 求 发 
送 给 相应 的 Web 服务 器 。 

(3) Web 服务 器 收 到 Web 浏览 器 发 送 来 的 请 求 后 ， 可 能 会 进行 两 种 操作 : @ 如 果 
Web 请 求 的 是 静态 内 容 (Static Content)，Web 服务 器 就 会 在 本 地 找到 这 些 资 源 (例如 HTML 
文件 、 图 片 或 者 存储 在 Web 服务 器 上 的 其 他 文件 )， 并 将 其 内 容 封装 到 HTTP 消息 体 中 ， 
以 消息 体 的 形式 返回 给 Web 服务 器 ，@@ 如 果 请 求 的 是 动态 内 容 (Dynamic Content)， 也 就 是 
说 ， 内 容 是 需要 动态 加 载 的 (这 样 做 的 好 处 是 可 以 与 后 台数 据 库 进 行 交互 操作 )， 那 么 服务 
器 就 会 通过 一 个 应 用 程序 来 生成 Web 响应 ， 并 发 送 给 Web 浏览 器 (服务 器 端 通常 使 用 通用 
网 关 接口 CGI 产生 动态 网 页 )。 

(4) Web 浏览 器 收 到 Web 响应 ， 并 加 载 ， 解 析 后 显示 在 用 户 的 屏幕 上 。 

上 述 过 程 如 图 8-1 所 示 。 


服务 器 收 到 Web 


EF 一 请 求 
大 \ > 
人 -一 -一 
根据 请 求 返回 响 
SB/ 5 应 报 文 


8-1 Web 应 用 在 服务 器 上 的 工作 过 程 
8.1.2 为 Web 应 用 创建 一 个 UI 


本 章 将 以 一 个 “网 上 书店 ”为 例 ， 来 对 Web 应 用 开发 进行 简要 介绍 。 

首先 开始 编写 网 上 书店 的 视图 代码 ， 这 会 创建 Web 应 用 的 用 户 界 面 (User Interface， 
UD。 在 Web 开发 中 ， 用 户 界面 通常 使 用 HTML 技术 来 创建 。 如 果 读 者 对 HTML 技术 还 
不 是 很 了 解 ， 可 能 需要 花 些 时 间 来 掌握 它 。 可 以 在 网 上 参考 一 些 相关 资料 ， 这 样 可 以 快速 
地 熟悉 HTML 的 一 些 基本 用 法 ， 也 可 以 阅读 一 些 相关 的 HTML 教材 去 深入 了 解 这 门 非常 
重要 的 Web 开发 技术 。 由 于 本 书 篇 幅 所 限 ， 本 章 拟 不 介绍 HTML 技术 。 

根据 平时 浏览 网 站 的 习惯 ， 在 输入 网 址 后 ， 首 先进 入 的 应 该 是 网 上 书店 的 首页 。 它 一 
般 包括 一 个 欢迎 标题 、 一 个 书店 的 图 标 ， 一 个 超 链接 子 页 面 和 相关 的 文字 介绍 。HTML 文 
件 代 码 如 下 。 

【 例 8-1】index.html 文件 的 内 容 : 

<!DOCTYPE html> 

<html lang="en"> 


<head> 
<meta charset="UTE 8"> 
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<title>BookStore</title> 
</head> 
<body> 
<hl>Welcome to My Book Store.</h1l> 
<img src="imgs/books.png"> 
<h3> 


please choose your favorite book, click <a href="...">here</a>. 


</h3> 
<p> 
<strong> Enjoy!</strong> 
</p> 
</body> 
</html> 


将 上 述 内 容 保存 为 .html 文件 后 ， 用 浏览 器 打开 ， 效 果 如 图 8-2 所 示 。 





画 aeoksrom 


CQ localhost/indexhtml 


Welcome to My Book Store. 


wy 


please choose your favorite book, click here. 


Enjoy! 


ER | 


Ho 








8-2 例 8-1 的 HTML 文件 使 用 浏览 器 打开 后 的 效果 


在 实际 的 网 站 开发 中 ， 为 每 个 网 页 都 编写 一 个 HTML 文件 是 极为 低 效 的 。 这 时 可 以 通 
过 编写 模板 文件 来 快速 生成 Web 页 面 。 例 如 ， 可 以 编写 一 个 模板 文件 并 保存 为 yate.py， 


之 后 ， 通 过 替换 yate.py 中 的 内 容 实现 网 页 的 快速 生成 。 


【 例 8-2】 模 板 文件 yate py: 


def start form(the url, form type="POST") : 


return('<form action="' + the url + '" method="' + form type + '">') 


def end form(submit msg="Submit"): 
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return('<input type=submit value="' + submit msg + '"></form>') 


def radio button (rb name, rb value): 
return('<input type="radio" name="' + rb name + 
'™ value="' + rb value + '">' + rb value + '<br />') 


def u list(items): 
u string = '<ul>' 
for item in items: 
u string += '<li>' + item + '</1i>"' 
u string += '</ul>"' 
return(u string) 


def header (header text, header level=2): 
return('<h' + str(header level) + '>' + header text + 
"</h' + str(header level) + '>') 
def para (Para text): 
return('<p>' + para text + '</p>') 


def link(the link,value): 
link string = '<a href="' + the link + '">' + value + '</a>' 
return (link string) 


在 以 后 的 应 用 中 ， 只 需要 用 import yate 命令 加 载 该 文件 ， 通 过 语句 : 
print (yate.header ('Book Detail:')) 


就 可 以 快速 地 定义 Web 页 面 标题 ， 这 显然 是 非常 方便 的 。 


8.2 使 用 MVC 设计 Web 应 用 


在 前 面 的 例子 中 ， 已 经 建立 了 两 个 代码 文件 ， 并 且 在 例 8-1 中 还 引入 了 一 个 图 片 文 
件 。 那 么 应 如 何 保存 这 些 文件 ? 何 种 方式 最 佳 呢 ? 

一 个 最 受 大 家 认可 的 Web 应 用 应 该 遵循 MVC(Model View Controller) 模 式 ， 这 种 模式 
更 加 有 利于 维护 和 管理 各 个 功能 模块 和 组 件 。 

MVC 是 “模型 (Model) 一 视图 (View) 一 控制 器 (Controller)” 的 缩写 ， 它 是 一 种 软件 设计 
典范 ， 用 一 种 将 业务 逻辑 、 数 据 、 界 面 显示 三 者 分 离 的 方法 组 织 代 码 ， 将 业务 逻辑 聚集 到 
一 个 部 件 里 面 ， 在 改进 和 个 性 化 定制 界面 及 用 户 交 互 的 同时 ， 不 需要 重新 编写 业务 逻辑 。 

模型 : 定义 数据 库 相 关 的 内 容 ， 一 般 放 在 models.py 文件 中 。 

视图 : 定义 HIML 等 静态 网 页 文件 相关 的 内 容 ， 即 HTML、CSS、JS 等 前 端 文件 。 

控制 器 : 定义 业务 逻辑 相关 的 内 容 ， 也 就 是 我 们 运行 的 主要 代码 。 

通俗 来 说 ，MVC 设计 就 是 一 种 文件 的 组 织 和 管理 形式 ， 它 将 不 同 的 文件 分 类 存放 ， 
以 方便 后 期 的 管理 。 采 用 MVC 设计 的 优点 是 很 明显 的 ， 分 层 的 设计 降低 了 Web 应 用 的 耦 
合 性 ， 人 允许 更 改 视图 层 代 码 而 不 用 重新 编译 模型 和 控制 器 代码 。 因 为 多 个 视图 可 以 共用 一 
个 模板 来 实现 ， 所 以 MVC 方法 具有 可 重用 性 高 、 部 署 快 、 可 维护 性 好 等 特点 。 
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8-3 就 是 推荐 的 一 种 文件 存储 结构 。 


一 一 顶层 文件 夹 ， 文 件 名 自 定义 。 保 存 
index html 文 件 和 一 些 ico 图 标 、 样 式 
webapp 表 文 件 等 


= 








-< 
广 ”人 GD， 用 来 保存 所 有 web 应 
， 用 代码 的 文件 夹 


_ 
一 一 一 将 所 有 的 数据 文件 或 


data 数据 库 文件 都 保存 在 
这 里 


PE 
一 一 如 果 存在 图 像 文件 ,将 
Imc 它们 保存 在 imgs 文 件 夹 
| 中 , 方便 查看 
将 我 们 在 代码 中 所 用 到 的 
ti 一 一 所 有 可 本文 件 保存 在 这 里 
例如 yate.py 文 件 


8-3 ”MVC 式 文件 存储 


8.3 使 用 CGI 将 程序 运行 在 服务 器 上 


通用 网 关 接口 (Common Gateway Interface，CGD 是 外 部 应 用 程序 (CGI 程序 ) 与 Web 服 
务 器 之 间 的 接口 标准 ， 人 允许 Web 服务 器 运行 一 个 服务 器 端 程序 ， 简 称 CGI 脚本 。 

一 般 情况 下 ，CGI 脚本 都 保存 在 cgi-bin 文件 夹 中 ， 这 样 ，Web 服务 器 能 方便 地 找到 
CGI 脚本 。 所 有 的 Web 应 用 都 要 在 Web 服务 器 上 运行 ， 实 际 上 ， 所 有 的 Web 服务 器 都 支 
持 CGI， 无 论 是 Apache、IIS、Nginx、Lighttpd 还 是 其 他 服务 器 ， 它 们 都 支持 用 Python 编 
写 的 CGI 脚本 。 这 些 Web 服务 器 功能 都 十 分 强大 ， 当 然 在 使 用 过 程 中 也 较为 复杂 。 相 对 
于 这 里 较 小 的 项 目 规模 ， 我 们 还 可 以 使 用 Python 自 带 的 简单 的 Web 服务 器 ， 这 个 Web 服 
务 器 包含 在 http.server 库 模块 中 。 

运行 下 面 的 程序 ， 就 可 以 启动 一 个 支持 CGI 的 Web 服务 器 。 

【 例 8-3】 启 动 Web 服务 器 : 

from http .server import HTTPServer, CGIHTTPRequestHandler 

port = 8080 

httpd = HTTPServer(('', port), CGIHTTPRequestHandler) 


print ("starting simple httpd on port: " + str (httpd.server port)) 
httpd.serve forever() 


CGI 标准 指出 ， 服 务 器 端 程序 (CGI 脚本 ) 生 成 的 任何 输出 都 将 会 由 Web 服务 器 捕获 ， 
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并 发 送 到 等 待 的 Web 浏览 器 。 具 体 来 说 ， 它 会 捕获 发 送 到 stdout( 标 准 输出 ) 的 所 有 内 容 。 
一 个 CGI 脚本 由 两 部 分 组 成 ， 第 一 部 分 输出 Response Headers， 第 二 部 分 输出 常规 的 
HTML 文件 。 其 中 Response Headers 部 分 一 般 用 如 下 语句 来 实现 : 


print ("Content-type:text/html\n") 


例如 在 “网 上 书店 ”的 例子 中 ，index.html 页 面 的 超 链接 “here” 会 链接 到 图 书 清单 页 
面 。 该 页 面包 含 一 个 标题 、 一 个 通过 服务 器 应 用 动态 生成 的 图 书 列表 和 返回 按钮 。 可 以 使 
用 yate 模板 来 实现 该 CGI 脚本 。 

【 例 8-4】 图 书 清单 页 面 。 

四 ”book list view.py: 


















































import cgitb 

cgitb .enable () 

# 启 用 这 个 模块 时 ， 会 在 Web 浏览 器 上 显示 详细 的 错误 信息 。enable () 函数 打开 CGI 跟踪 

#CGI 脚本 产生 一 个 异常 时 ，Python 会 将 消息 显示 在 stderr (标准 出 错 文件 ) 上 。CcGI 机 制 会 忽略 
这 个 输出 ， 因 为 它 想 要 的 只 是 CGI 的 标准 输出 (stdout) 

from templates import yate 

import book service 


print ("Content-type:text/html\n")#Response Headers 
# 网 页 内 容 ， 由 HTML 标签 组 成 的 文本 
print('<html>') 
print ('<head>') 
print('<title>Book List</title>') 
print ('</head>') 
print ('<body>') 
print('<h2>Book List:</h2>') 
print (yate.start form('book detail view.py')) 间 调 用 模板 生成 图 书 列 表 
book dict=book service.get book dict() ## 调 用 图 书 管理 模块 提取 图 书信 息 
for book name in book dict: 
print (yate.radio button ('bookname',book dict[book name] .name) ) 
print (yate.end form('detail')) 
print (yate.link("/index.html", 'Home')) 
print ('</body>') 
print('</html>') 


©® book service.py: 


from templates import Book 


def get book dict(): 
book dict={} 
try: 
with open('data\\book.txt','r') as book file: 
for each line in book file: 
book=parse (each line) 
book dict[book.name]=book 
except IOError as ioerr: 
print ("IOErr:",ioerr) 
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return (book dict) 


def parse (book info): 
(name,author,price)=book info.split(';') 
book=Book .Book (name, author, price) 
return (book) 


® Bookpy: 
from templates import yate 


class Book: 
def init (self,name,author,price): 
self.name=name 
self.author=author 
self.price=price 


@property 

def get html (self): 
RE Er= 
html str+=yate.header('BookName:',4)+yate.para(self.name) 
html str+=yate.header('Author:',4)+yate.para(self.author) 
html str+=yate.header('Price:',4)+yate.para(self.price) 
return (html str) 


上 面 的 代码 一 共 包 含 三 个 文件 ， 图 书 列表 视图 文件 book list_view.py、 图 书 处 理 罗 辑 


文件 book_service.py 和 定义 书籍 类 的 文件 Book.py。 其 中 ，book_service.py 文件 从 本 地 的 
book.txt 文件 中 提取 出 书籍 信息 ， 调 用 Book 类 生成 Book 对 象 ， 并 以 字典 格式 保存 所 有 的 
书籍 信息 后 ， 返 回 给 book list view.py 中 的 book dict， 然 后 通过 模板 生成 书籍 列表 内 容 。 


待 显示 的 图 书信 息 以 “ 书 名 ， 作 者 ; 价格 ”的 格式 保存 在 book.txt 文件 中 ， 如 图 8-4 


所 示 。 


给 














为 
板 
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文件 (E) 编辑 (E) 格式 (0) 查看 (V) 帮助 (H) ] 
The Linux Programming Interface: A Linux and UNIX System Prog;Michael Kerrisk; 中 
$123. 01 

HTML5 and CSS3, Illustrated Complete (Illustrated Series) ;Jonathan Meersman Sasha 
Vodnik;$32. 23 

Understanding the Linux Kernel;Daniel P. Bovet Marco Cesati;$45. 88 

Getting Real;Jason Fried，Heinemeier David Hansson，Matthew Linderman;$87. 99| 





图 8-4 待 显 示 的 图 书信 息 


运行 book_list_view.py 文件 ， 可 以 得 到 如 图 8-5 所 示 的 输出 。 

最 后 一 个 页 面 是 详细 的 图 书信 息 页 面 。 在 这 个 CGI 脚本 中 ， 首 先 要 获得 上 级 表单 提交 
Web 服务 器 的 值 BookName， 并 通过 BookName 判断 需要 动态 加 载 的 书籍 信息 。 完 成 上 
的 目标 可 以 通过 使 用 CGI 库 的 cgi.FieldStorage() 来 实现 。 

cgi.FieldStorage() 方 法 访问 Web 浏览 器 发 送 给 Web 服务 器 的 数据 ， 并 将 这 些 数据 保存 
一 个 Python 字典 。 在 确定 书籍 名 称 后 ， 即 可 访问 本 地 book 数据 字典 ， 之 后 调用 yate 模 
生成 视图 页 面 。 


准 浴 


;5 


Content-type:text/htnl 


<html7 

<head7 

<title>Book List</title> 

S/head> 

body> 

<h2>Book List:C/h2> 

<form action="book_detail_view. py” method=“POST”> 

input type="radio” name="booknane” value=“HIML5 and CSS3，Illustrated Conmplete (Illustrated Series)"”> HIML5 and CSS: 
input type=“radio” name="booknane” value="Getting Real”> Getting Realxbr /> 

《input trpe="radio” name="booknane” value="Understanding the Linux Kernel”> Understanding the Linux Kernelbr /> 
《input type="radio” name="booknane” value="The Linux Programming Interface: A Linux and UNIX System Prog’> The Linux 
《input type=submit value="detail”></form> 

a href="/index. html”>Hone</a> 

/body> 

</html> 


8-5 ”book_list_view.py 的 运行 效果 


这 里 需要 注意 的 是 ， 表 单 可 能 返回 的 是 一 个 None 值 ， 即 用 户 可 能 没有 选取 任何 书 
所 以 需要 用 一 个 try/except 语句 来 保护 代码 ， 当 bookname 值 为 空 时 ， 提 醒 用 户 选择 书 
具体 的 代码 包含 在 下 面 的 例子 中 。 

【 例 8-$】 图 书 详细 页 面 。 
book detail view.py: 

















import cgitb 
cgitb.enable() 


import cgi 
import templates.yate as yate 
import book service 


form data = cgi.Fieldstorage() 


print ("Content-type:text/html\n") 
print('<html>') 
print ('<head>') 
print('<title>Book List</title>') 
print ('</head>') 
print ('<body>') 
print (yate.header ('Book Detail:')) 
try: 
book name = form data['bookname'] .value 
book dict=book service.get book dict() 
book=book dict[book name] 
Print (book.get html) 
except KeyError as kerr: 
print (yate.para('please choose a book...')) 
print (yate.link("/index.html", 'Home')) 
print (yate.link("/cgi-bin/book list view.py",'Book List')) 
print ('</body>"') 
print('</html>') 
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所 有 文件 保存 后 ， 整 个 工程 文件 的 结构 如 图 8-6 所 示 。 


国 -sw 


-一 EE book list_ view.py 


一 \ cgi-bin 一 站 book service.py 
上- 一 皇 book_detail view.py 


一 一 | ww 一 一 国 bookwe 
ml 
imgs 








一 重 init_py 
aaaae 二 一 蚤 Bookpy 
-一 着 yatepy 
Nm 咎 simple_httpd.py 





index.html 





8-6 全 部 工程 文件 的 结构 


首先 运行 服务 器 文件 simple_ httpdpy， 得 到 输出 “Starting simple_ httpd on port: 8080” 
后 ， 说 明 服务 器 已 经 开始 正常 运行 并 监听 输出 内 容 。 

这 时 在 浏览 器 输入 http:/127.0.0.1:8080/( 本 地 服务 器 地 址 )， 就 可 以 打开 我 们 的 “网 上 
书店 ”页 面 ， 运 行 效果 如 图 8-7 所 示 ( 请 读者 注意 图 8-2 与 图 8-7 的 区 别 )。 





© | 0 127.00.13080 


Welcome to My Book Store. 


© 


please choose your favorite book, click here. 
Enjoy! 


8-7 ”网 上 书店 首页 截图 
单 击 here 链接 后 ， 执 行 book list_view.py 文件 ， 运 行 效果 如 图 8-8 所 示 。 
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《4 了 © © 1270018080/cgibin/book list viewpy 


Book List: 





;The Linux Programming Interface: A Linux and UNIX System Prog 


，Understanding the Linux Kemel 
© HTMLS and CS53, Illustrated Complete (lllustrated Series) 


9 Getting Real 
etal 


Home 





8-8 单 击 here 后 的 页 面 截图 


选择 书籍 后 ， 单 击 detail， 可 以 查看 图 书 细节 ， 这 时 跳 转 到 book_detail_view.py 文件 ， 
运行 效果 如 图 8-9 所 示 。 


[DD book Uist 
€ 3 © | ©12700.1:8080/cgi-bin/book detail view.py 


Book Detail: 


BookName: 





HTMLS and CSS3, lllustrated Complete (lllustrated Series) 


Author: 


Jonathan Meersman Sasha Vodnik 





8-9” 跳 转 到 book_detail_view.py 文件 运行 后 的 截图 


控制 台 监 控 到 的 请 求 信息 如 图 8-10 所 示 。 
.CA 
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D:\Anaconda3\python. exe D:/web 开 发 /simple_httpd. py 
Starting simple_httpd on port: 8080 


127. 
双开 
二 
2975 
127. 
站 
2 
127. 
127 
127. 
127. 
127. 
127. 
127. 
127. 
127. 












0.0.1 - - [16/Mar/2017 09:01:25] “GET / HITP/1.1” 200 — 

0.0.1 - - [16/Mar/2017 09:01:25] “GET /imgs/books. png HTTP/1.1” 200 — 

0.0.1 - - [16/Mar/2017 09:01:25] code 404, message File not found 

0.0.1 - - [16/Mar/2017 09:01:25] “GET /favicon. ico HTTP/1.1” 404 — 

0.0.1 - - [16/Mar/2017 09:03:26] “GET /cgi-bin/book_list_view.py HITP/1.1” 200 — 

0.0.1 - - [16/Mar/2017 09:03:26] command: D:\Anaconda3\python. exe -u D:\web 开 发 \cgi-bin\book_list_view.py ” 
0.0.1 - - [16/Mar/2017 09:03:27] CGI script exited OK 

0.0.1 - - [16/Mar/2017 09:07:54] “POST /cgi-bin/book_detail_view.py HITP/1.1” 200 — 

0.0.1 - - [16/Mar/2017 09:07:54] command: D:\Anaconda3\python. exe ~u D:\web 开 发 \cgi-bin\book_detail_view.py ” 
0.0.1 - - [16/Mar/2017 09:07:54] CGI script exited OK 

0.0.1 - - [16/Mar/2017 09:08:31] “GET /cgi-bin/book_list_view.py HITP/1.1” 200 — 

0.0.1 - - [16/Mar/2017 09:08:31] command: D:\Anaconda3\python. exe -u D:\web 开 发 \cgi-bin\book_list_view. py “” 
0.0.1 - - [16/Mar/2017 09:08:31] CGI script exited OK 

0.0.1 - - [16/Mar/2017 09:09:02] “POST /cgi-bin/book_detail_view. py HTTP/1.1”200 — 

0.0.1 - - [16/Mar/2017 09:09:02] command: D:\Anaconda3\python. exe -u D:\web 开 发 \cgi-bin\book_detail_view. py ”” 
0.0.1 - - [16/Mar/2017 09:09:03] CGI script exited OK 


图 8-10 控制 台 消息 
8.4 案例 实 训 : Web 页 面 获取 表格 内 容 并 显示 


前 面 以 一 个 “网 上 书店 ”实例 ， 


对 如 何 使 用 Python 进行 Web 开发 做 了 详细 的 讲解 。 


本 案例 以 获取 表格 内 容 并 显示 为 例 ， 


中 ， 首 先 由 用 户 通 过 一 个 HTML 页 务 





曾 输 入 数据 ， 并 提交 给 CGI 服务 器 ， 


再 次 对 整个 Web 开发 的 主要 过 程 进 行 回顾 。 在 本 例 
然后 通过 CGI 脚 


本 获取 其 内 容 并 返回 到 HTML 页 面 中 显示 出 来 。 
首先 ， 建 立 一 个 工程 文件 夹 www， 并 在 文件 夹 下 建立 simple_httpd.py 文件 。 在 该 文件 


中 输入 下 面 的 代码 并 运行 ， 打 开 CGI 


服务 : 


/248\. 


from http.server import HTTPServer, CGIHTTPRequestHandler 

port = 8080 

httpd = HTTPServer(('', port), CGIHTTPRequestHandler) 

print ("starting simple httpd on port: " + str(httpd.server port) 
httpd.serve forever() 


其 次 ， 在 www 文件 夹 中 建立 一 个 首页 文件 index.html， 代 码 如 下 : 


<!DOCTYPE html> 
<html lang="en"> 
<head> 
<meta charset="utf=8"> 
<title>Web 开发 案例 </title> 
</head> 
</head> 
<body> 
<hl>Web 开发 案例 </h1> 
<div> 
<form name="input" action="/cgi-bin/testl.py" method="get"> 
姓名 : <input type="text" name="name"><br> 
学 号 : <input type="text" name="id"><br> 
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专业 : <input type="text" name="specialty"><br> 
分 数 : <input type="text" name="score"><br> 
<input type="submit" value=" 提 交 "> 
</form> 
</div> 
</body> 
</html> 


在 浏览 器 的 地 址 栏 中 输入 地 址 http://127. 0. 0. 1:8080/( 本 地 服务 器 地 址 )， 即 可 访问 
到 index. html 文件 ， 效 果 如 图 8-11 所 示 。 
3 尖 注意 : 在 index.html 文件 的 form 表单 里 设置 了 语句 action=“/cgi-bin/testl.py”， 旨 在 
实现 单 击 页 面 中 的 “提交 ”按钮 后 能 够 调用 同一 目录 下 cgi-bin 文件 夹 中 的 
testl.py 文件 。 





a -En 
四 Web 开发 案例 x 全 下 


CQ | © 127.0.0.1:8080 图 胡 


Web 开发 案例 : 


姓名 : 
学 号 : 
专业 : 
分 数 : 

提交 | 

















8-11 在 浏览 器 中 输入 http://127.0.0.1:8080/ 后 显示 的 页 面 


最 后 ， 在 www 文件 夹 下 新 建文 件 夹 cgi-bin， 用 来 保存 我 们 的 testl py 文件 。 
testLpy 文件 的 代码 如 下 : 


import cgi 


form = cgi.Fieldstorage() 

print ("Content-Type: text/html") 

print (Cy 

print ("<html>") 

print ("<h2>CGI 服务 器 接收 到 的 数据 </h2>") 

print ("<p>") 

print ("用 户 提交 的 信息 :<br>") 

print ("<b> 姓 名 :</b> " + form["name"] .value + "<br>") 
print ("<b> 学 号 :</b> " + form["id"] .value + "<br>") 
print ("<b> 专 业 :</b> " + form["specialty"] .value + "<br>") 
print ("<b> 分 数 :</b> " + form["score"] .value + "<br>") 
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PrinE (</pony 

print ("</html>") 

如 前 所 述 ，index.html 页 面 中 提交 的 表单 内 容 会 被 封装 在 一 个 cgi.FieldStorage 对 象 
中 。 通 过 form = cgi.FieldStorage0) 语 句 即 可 在 CGI 服务 器 中 获取 其 内 容 ， 然 后 通过 print 语 
句 将 form 中 的 内 容 输出 ， 并 返回 给 浏览 器 。 

创建 完成 后 ， 我 们 测试 一 下 实际 运行 的 效果 。 在 Web 页 面 中 输入 图 8-12 所 示 的 数据 
后 单 击 “ 提 交 ” 按 钮 ， 提 交 后 的 页 面 如 图 8-13 所 示 。 可 见 ，Web 表格 中 的 内 容 被 提取 出 
未 于 


也 Web 开发 率 例 
> C | © 127.0.0.1:8080 








Web 开发 案例 : 


姓名 : 张 伟 

学 号 : |151223412 
专业 : 计算 机 科学 与 技术 
分 数 : ee 

| 提交 | 





8-12 ”在 表单 中 输入 数据 


口 127.0.0.1:8080/cgi-bin, x WO 





二 C | © 127.0.0.1:8080/cgi-bin/test1.py?name= 张 伟 &id=15 从 | # 


CGI 服务 器 接收 到 的 数据 





专业 : 计算 机 科学 与 技术 
分 数 : 89 





图 8-13 单 击 “提交 ”按钮 后 显示 的 内 容 
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本 章 小 结 


本 章 先是 通过 一 个 “网 上 书店 ”例子 初步 介绍 了 使 用 Python 语言 进行 Web 开发 的 过 
程 ， 然 后 以 提取 Web 表格 内 容 为 案例 ， 回 顾 了 Web 开发 的 主要 过 程 。 学 习 过 其 他 Web 开 
发 语言 的 读者 可 能 会 感觉 到 ， 相 对 于 Java、C# 等 语言 ， 使 用 Python 开发 Web 是 一 件 非 常 
轻松 的 事情 。 没 有 复杂 的 步骤 ， 也 没有 元 长 的 代码 ， 而 且 Python 语言 可 以 很 好 地 与 其 他 语 
言 结合 ， 这 使 得 它 在 页 面 交互 方面 的 应 用 更 加 轻松 。 因 此 ， 很 多 大 型 的 网 站 ， 如 知 乎 、 网 
易 、 腾 讯 、 搜 狐 等 ， 都 在 网 站 开发 中 使 用 了 大 量 的 Python 技术 。 


习 题 




















1. 填空 题 


(1) 基于 Web 开发 的 应 用 具有 ( )、( )、( )、( )、( ) 竺 
优点 。 

(2) MVC 模式 是 ( bo )( ) 的 缩写 。 

(3) 在 实际 的 网 站 开发 中 ， 为 每 个 网 页 都 编写 一 个 HTML 文件 是 极为 低 效 的 。 这 时 可 
以 通过 编写 ( ) 来 快速 生成 Web 页 面 。 


2. 选择 题 

(1) 更 具体 地 说 ，MVC 是 一 种 ( )。 
A. 文件 组 织 和 管理 形式 B. 软件 设计 方法 
C. 界面 设计 方法 D. Web 开发 方法 


(2) 在 Web 开发 中 ，CGI 指 的 是 (  )。 
A. 计算 机 图 形 接口 (Computer Graphics Interface) 
B. 全 球 小 区 识别 码 (Cell Global Identifier) 
C. 计算 机 生成 影像 (Computer-Generated Imagery) 
D. 通用 网 关 接 口 (Common Gateway Interface) 


3. 简 答题 

(1) MVC 设计 模式 将 应 用 程序 按 用 户 界面 的 功能 划分 为 哪 几 类 ? 
(2) 使 用 MVC 模式 有 什么 好 处 ? 

(3) 什么 是 CGI? 


4. 实验 操作 题 
如 何 使 用 Python 自 带 的 http.server 库 模块 建立 服务 器 ?请 写 出 具体 代码 。 
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TI om 区 >》 Python 程序 设计 实用 教程 


本 章 要 点 


(1) 使 用 Python 进行 数据 挖 气 的 原因 。 

(2) NumPy 库 。 

(3) SciPy 库 。 

(4) Matplotlib 库 。 

(5) Pandas 库 。 

(6) 数据 可 视 化 。 

学 习 目 标 

(1) 了 解 Python 在 数据 挖 据 方面 的 应 用 。 

(2) 掌握 NumPy 库 的 安装 和 使 用 。 

(3) 掌握 SciPy 库 的 安装 和 使 用 。 

(4) 掌握 如 何 使 用 Matplotlib 库 画 图 。 

(5) 掌握 Pandas 库 的 两 种 重要 类 型 DataFrame、Series。 
(6) 掌握 利用 Python 进行 数据 可 视 化 的 方法 。 


Python 语言 在 进行 数据 分 析 方 面 有 着 强大 的 优势 ， 它 处 理 速度 快 ， 编 程 效 率 高 ， 支 持 
数据 的 可 视 化 ， 这 些 特性 使 其 很 快 成 为 进行 数据 分 析 的 主流 编程 语言 之 一 。 本 章 将 对 其 在 
数据 分 析 上 的 应 用 和 优势 进行 详细 介绍 。 

由 于 数据 挖掘 是 数据 分 析 的 高 级 形式 ， 所 以 本 章 内 容 较 多 地 涉及 数据 挖掘 。 


9.1 数据 挖掘 简介 


数据 挖掘 是 从 大 量 的 数据 (包括 文本 ) 中 挖掘 出 隐 含 的 、 先 前 未 知 的 、 对 决策 有 潜在 价 
值 的 关系 、 模 式 和 趋势 ， 并 用 这 些 知识 和 规则 建立 用 于 决策 支持 的 模型 ， 提 供 预测 性 决策 
支持 的 方法 、 工 具 和 过 程 。 

数据 挖掘 有 助 于 企业 发 现 业务 的 趋势 ， 揭 示 已 知 的 事实 ， 预 测 未 知 的 结果 ， 因 此 数据 
挖掘 已 成 为 企业 保持 竞争 力 的 必要 手段 。 

数据 挖掘 由 以 下 步骤 组 成 。 

(1) 数据 清理 (消除 噪声 和 删除 不 一 致 的 数据 )。 

(2) 数据 集成 (将 多 种 数据 源 组 合 在 一 起 )。 

(3) 数据 选择 (从 数据 库 中 提取 与 分 析 任 务 相 关 的 数据 )。 

(4) 数据 变换 (通过 汇总 或 聚集 操作 ， 把 数据 变换 和 统一 成 适合 挖掘 的 形式 )。 

(5) 数据 挖掘 (基本 步骤 ， 使 用 智能 的 方法 提取 数据 模式 )。 

(6) 模式 评估 (根据 某 种 兴趣 度 度 量 ， 识 别 代表 知识 的 真正 有 趣 的 模式 )。 

(7) 知识 表示 (使 用 可 视 化 和 知识 表示 技术 ， 向 用 户 提供 挖掘 的 知识 )。 

其 中 ， 步 又 (1) ~ (4) 是 数据 预 处 理 的 不 同形 式 ， 为 数据 挖掘 做 准备 。 
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9.2 ”为 什么 选择 Python 进行 数据 挖掘 


Python 本 身 是 一 门 简单 易学 的 语言 ， 它 优雅 的 语法 和 动态 的 类 型 ， 结 合 它 的 解释 性 ， 
使 其 在 很 多 领域 成 为 编写 脚本 或 开发 程序 的 理想 语言 。 相 对 于 Matlab 开发 工具 ，Python 可 
以 完成 Matlab 可 以 完成 的 所 有 任务 。 而 且 在 大 多 数 情况 下 ， 相 同 功 能 的 Python 代码 会 比 
Matlab 代码 更 加 简洁 和 易 懂 。 

同时 ，Python 毕竟 还 是 一 门 编程 语言 ， 它 在 开发 网 页 、 开 发 游戏 、 编 写 网 络 爬 虫 获取 
数据 等 方面 的 应 用 也 是 Matlab 所 不 能 及 的 。 

Python 语言 以 高 效 和 简洁 著称 ， 致 力 于 用 最 简洁 、 最 简短 的 代码 完成 任务 。 相 对 于 
Java、C/C++ 等 语言 ，Python 快速 编程 、 快 速 验 证 的 特性 又 十 分 适合 数据 挖掘 所 要 求 的 时 

Python 语言 经 常 受 人 诉 病 的 是 它 的 运行 效率 ， 但 是 ，Python 还 被 称 为 胶水 语言 ， 它 可 
以 很 好 地 兼容 C/C++ 语言 ， 核 心 部 分 用 C/C++ 等 更 高 效 的 语言 来 编写 ， 然 后 通过 Python 粘 
合 ， 因 此 其 效率 问题 可 以 很 好 地 得 到 解决 。 这 一 点 早 在 第 1 章 已 经 提 到 。 

同时 ， 随 着 大 量 应 用 于 数据 挖掘 的 程序 库 的 开发 ， 例 如 NumPy、SciPy、Matplotlib 和 
Pandas 等 ， 在 大 多 数 的 数据 科学 计算 任务 上 ，Python 语言 的 运行 效率 已 经 可 以 媲美 C/C++ 
语言 了 。 

随 着 近年 来 Python 被 越 来 越 多 的 人 所 关注 ， 应 用 于 数据 处 理 的 Python 程序 库 与 日 俱 
增 ， 可 以 预见 的 是 ，Python 语言 正在 慢 慢 地 成 为 数据 科学 领域 的 主流 编程 语言 。 大 数据 时 
代 的 到 来 ， 更 使 Python 有 了 用 武之 地 。 


9.3 Python 的 主要 数据 分 析 工 具 


Python 语言 本 身 的 数据 处 理 能 力 并 不 是 很 强 ， 它 主要 依靠 众多 的 第 三 方 库 来 增强 其 能 
力 ， 像 常用 的 NumPy 库 、SciPy 库 、Matplotlib 库 、Pandas 库 、Scikit-Learn 库 、Keras 库 
和 Gensim 库 等 。 本 节 主 要 就 这 些 库 的 基本 应 用 进行 介绍 。 

常规 版 本 的 Python 需要 在 安装 完成 后 男 外 下 载 相应 的 第 三 方 库 来 安装 上 述 库 文件 ， 而 
如 果 安 装 的 是 Anaconda 发 行 版 本 的 Python， 那 么 它 可 能 已 经 同时 安装 了 下 面 的 库 : 
NumPy、 SciPy、Matplotlib、Pandas、Scikit-Learn。 

Anaconda 是 一 个 专门 用 于 科学 计算 的 Python 版 本 ， 里 面包 含 了 大 量 关 于 数据 计算 和 
数据 挖掘 的 工具 。 如 果 用 户 应 用 Python 专门 从 事 大 量 关 于 数据 科学 计算 的 工作 ，Anaconda 
版 本 的 Python 将 不 需要 我 们 再 一 个 一 个 地 安装 各 种 库 。 











9.3.1 NumPy 库 


Python 本 身 并 没有 提供 数组 功能 。 虽 然 其 列表 功能 已 经 可 以 完全 代 蔡 数组 的 功能 ， 但 
在 进行 数据 科学 计算 时 ， 常 常 需要 面 对 大 量 的 数据 和 复杂 的 运算 过 程 。 这 时 ， 列 表 就 不 能 
很 好 地 适应 我 们 的 需求 了 。NumpPy 是 专门 为 了 进行 严格 的 数据 处 理 而 开发 的 ， 它 提供 了 一 
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个 非常 强大 的 N 维 数组 对 象 Array 和 实用 的 线性 代数 、 传 里 叶 变换 和 随机 数 生成 函数 ， 这 
个 工具 可 以 用 来 存储 和 处 理 大 型 的 矩阵 ， 且 处 理 速度 是 C 语言 级 别 的 ! 同时 ， 后 面 将 要 介 
绍 的 SciPy、Matplotlib、Pandas 等 库 都 依赖 于 它 。 

1. 安装 NumPy 库 

在 Windows 系统 中 ，NumPy 可 以 像 安装 其 他 库 一 样 ， 通 过 pip 安装 : 

pip install NumPy 

也 可 以 先 自行 下 载 所 需要 的 其 他 版 本 的 NumPy， 然 后 用 如 下 命令 来 安装 : 

python setup.py install 

在 Linux 系统 中 也 可 以 通过 上 面 的 方法 进行 安装 。 此 外 ， 还 可 以 通过 Linux 自 带 的 软 
件 管理 器 进行 安装 ， 如 在 Ubuntu 版 本 下 ， 可 以 通过 使 用 如 下 命令 进行 安装 : 

sudo apt-get install Python-Numpy 

安装 完成 后 ， 可 以 通过 下 面 的 语句 进行 测试 ， 看 安装 是 否 成 功 : 


import numpy as np 
print (np.version.version) 


如 果 安 装 正确 ， 将 会 输出 NumpPy 的 版 本 号 。 

2. 多 维 数组 ndarray 

ndarray 是 NumPy 最 重要 的 组 成 部 分 ， 该 对 象 是 一 个 快速 而 又 灵活 的 大 数据 集 容 器 ， 
可 以 利用 这 种 数组 对 整 块 的 数据 执行 数学 运算 。 

(1) 创建 ndarray。 

创建 数组 最 简单 的 办 法 就 是 使 用 array 函数 。 它 接收 一 切 序 列 类 型 的 对 象 (例如 list、 
tuple、 其 他 数组 等 )， 然 后 生成 一 个 含有 传 入 数据 的 NumPy 数组 。 

【 例 9-1】 生 成 ndarray 对 象 : 


import numpy as np 























[er ve: i # 生 成 一 个 列表 对 象 
(5，9，6.3，7，0，1) # 生 成 一 个 元 组 对 象 


datal 
data2 


arrl = np.array (datal) # 利 用 列表 对 象 生成 ndarray 对 象 
arr2 = np.array (data2) 间 利 用 元 组 对 象 生 成 ndarray 对 象 


print (type (arrl) ) # 输 出 arrl 的 数据 类 型 
print (arrl) 
print (arr2) 


输出 结果 : 
《class“numpy.ndarray > 
[人 7556 66. i 
[ 5. 9. 63 1 0. | 
>>> | 
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利用 嵌 套 序列 (例如 由 一 组 等 长 的 列表 组 成 的 列表 ) 可 以 生成 一 个 多 维 数组 。 
【 例 9-2】 生 成 多 维 数组 : 


import numpy as np 


data = [[1，2，3]，[4，5，6]，[7，8，9]] 间 一 个 由 列表 组 成 的 列表 
arr = np.array (data) 间 转 换 为 一 个 二 维 数组 


print (arr) 
print ("数组 维 数 :，" + str(arr.ndim) ) # 输 出 数组 的 维度 
print ("数组 类 型 : " + str (arr.shape)) # 输 出 数组 的 行列 数 


输出 结果 为 : 
[[1 2 3] 


在 生成 数组 的 时 候 ， 还 可 以 指定 其 数据 类 型 ， 例 如 numpy.int32、numpy.int16 和 
numpy.float64 等 。 

【 例 9-3】 生 成 数组 时 指定 数据 类 型 : 

import numpy as np 

data = [1.77，2，3，4，5，6] # 生 成 一 个 列表 对 象 

arr = np.array (data,np.int32) # 转 换 为 一 个 数组 对 象 

print (arr) 

输出 结果 : 

[12345 6] 

| >>> | 

可 见 ， 输 出 的 列表 已 经 自动 保留 整数 部 分 。 

(2) 创建 特殊 数组 。 

除了 上 面 提 到 的 可 以 利用 array 创建 数组 外 ， 还 可 以 利用 numpy.zeros、numpy.ones、 
numpy.eye 等 方法 构造 特定 的 数组 。 

【 例 9-4】 创 建 特殊 数组 : 


import numpy as np 


arrl = np.zeros((3，4)) # 生 成 一 个 3 行 4 列 的 全 0 数组 
arr2 = np.ones((3，4)) # 生 成 一 个 3 行 4 列 的 全 1 数组 
arr3 = np.eye (3) # 生 成 一 个 三 阶 单位 数组 


print ("全 0 数组 : \n"，arrl) 
print ("全 1 数组 : \n"，arr2) 
print ("单位 数组 : \n"，arr3) 


输出 结果 : 
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: 在 第 3 章 中 ， 我 们 曾 使 用 双重 循环 来 构造 一 个 3x3 的 全 0 矩阵 (参见 例 3-29)。 
这 里 ， 仅 使 用 一 条 语句 “arr0 = np.zeros((3, 3))” 即 可 实现 同样 的 功能 。 


由 此 可 


见 ， 恰 当地 运用 第 三 方 扩展 库 进 行 Python 编程 是 何等 的 简洁 ! 其 实 ， 不 仅仅 


是 程序 简洁 ， 


执行 效率 也 会 有 1~2 个 数量 级 的 提高 (C/C++ 的 执行 效率 )。 


表 9-1 中 列 出 了 常用 的 一 些 数组 创建 函数 。 另 外 ， 由 于 NumpPy 库 主 要 用 于 数据 科学 计 
算 ， 所 以 在 默认 的 情况 下 ， 数 据 类 型 基本 上 都 是 float64( 浮 点 类 型 )。 


表 9-1 常用 的 数组 创建 函数 


函数 名 


array 


arange 


ones、ones like 


Zeros、 zeros_like 
empty、empty_like 
eye、 identity 





说 明 


将 输入 的 数据 (列表 、 元 组 、 数 组 或 其 他 序列 类 型 ) 转 换 成 ndarray 


asarray 将 输入 转换 为 ndaray， 如 果 输 入 一 个 ndarray 则 不 会 进行 复制 
类 似 于 Python 内 置 的 range0 函 数 ， 但 返回 的 是 一 个 ndarray 类 型 ， 而 不 是 list 


类 型 


根据 指定 的 形状 和 格式 (dtype) 创 建 一 个 全 为 1 的 数组 。ones_like 以 另 一 个 数组 


做 参数 生成 一 个 全 为 1 的 数组 


功能 类 似 于 ones、ones_like， 不 过 生成 的 是 全 为 0 的 数组 
生成 一 个 新 的 数组 但 只 分 配 存储 空间 ， 而 随机 生成 一 些 未 初始 化 的 值 
创建 一 个 正方 形 的 对 角 线 全 为 1 的 单位 数组 


9.3.2 SciPy 库 


NumPy 库 的 加 入 ， 使 人 们 可 以 高 效 地 处 理 数据 了 ， 但 是 ， 尽 管 NumPy 提供 了 多 维 数 
组 的 功能 和 大 量 的 生成 函数 ， 但 它 并 不 是 真正 意义 上 的 矩阵 。 例 如 ， 当 两 个 数组 相 乘 时 ， 
只 是 对 应 元 素 的 相 乘 ， 而 非 数学 意义 上 的 矩阵 乘法 。SciPy 库 则 提供 了 真正 的 矩阵 ， 以 及 
大 量 的 基于 矩阵 运算 的 对 象 和 函数 。 

SciPy 包含 的 功能 有 最 优化 、 线 性 代数 、 积 分 、 插 值 、 拟 合 、 特 殊 函 数 、 快 速 傅 里 叶 
变换 、 信 号 处 理 和 图 像 处 理 、 常 微分 方程 求解 和 其 他 科学 与 工程 中 常用 的 计算 。 这 些 功能 
在 进行 数据 挖掘 时 都 是 必 不 可 少 的 。 


SciPy 库 依 赖 于 NumPy 库 ， 因 








此 在 安装 SciPy 库 之 前 ， 须 先 安装 好 NumPy 库 ， 利 用 


SciPyt+NumPy 组 合 可 以 解决 大 量 的 原本 需要 C++ 或 者 Matlab 才能 解决 的 问题 。 
1. 安装 SciPy 库 


SciPy 库 的 安装 过 程 类 似 了 


125. 





FF NumPy 库 ， 同 样 可 以 使 用 pip 安装 或 者 自行 安装 ， 在 


Ubuntu 环境 下 也 可 以 


sudo apt-get i 
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通过 如 下 命令 进行 安装 ; 


nstall Python-SciPy 


安装 成 功 后 ， 可 以 用 如 下 命令 测试 是 否 安装 成 功 : 


import SciPy， 
print (SciPy.ve 


numpy 
rsion.full version) 


如 果 安 装 成 功 ， 将 会 显示 SciPy 的 版 本 号 和 True 值 。 
2. 常用 SciPy 工具 包 


表 9-2 是 一 些 常 


用 的 SciPy 工具 包 。 因 本 书 篇 幅 所 限 ， 此 处 不 一 一 详 述 ， 具 体内 容 可 


参考 http:/www.SciPy.org 网 站 ， 或 参考 SciPy and Numpy 一 书 (参考 文献 [21])。 


表 9-2 常用 SciPy 工具 包 























soPyIR | 功能 
a 层次 聚 类 (cluster.hierarchy) 
矢量 量化 到 均值 (cluster.vq) 
constants 的 全 和 和 直下 报 
转换 方法 
fftpack 离散 傅 里 叶 变 换算 法 
integrate 积分 例 程 
interpolate 插值 (线性 的 、 三 次 方 的 等 ) 
io 数据 输入 和 输出 
linalg 采用 优化 BLAS 和 LAPACK 库 的 线性 代数 函数 
maxentropy 最 大 粒 模 型 的 函数 
ndimage mn 维 图 像 工 具 包 
-Pimize | 最 优化 避 找 极 小 信和 的 根 
signal 信号 处 理 
sparse 稀疏 矩阵 
spatial 空间 数据 结构 和 算法 
special 特殊 数学 函数 ， 如 贝 塞 尔 函 数 (Bessel) 或 雅 可 比 函数 (Jacobian) 
stats 统计 学 工具 包 





【 例 9-5】 使 用 SciPy 求解 下 FE 


2w+x—5y+2z= 


W—3x—6z=9 
2x—y+2z=-5 





面 的 线性 方程 组 : 
8 


w+4x—7y+6z=0 


程序 如 下 : 
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import scipy 
from scipy import linalg 


a= scipy-mat("[2 1 -5 1;1 -3 0 -6;:0 2 -1 2;1 4 =7 6]7) 


b=scipy.mat (' [8;9;-5;0]"') 
solve = linalg.solvel(a, b) 


print (solve) 


w=3 


【 例 9-6】 使 用 SciPy.ndimage 对 图 像 进行 处 理 : 


from scipy import ndimage 
from scipy import misc 
import pylab as pl 
ascent = misc.ascent() 


shifted ascent = ndimage.shift (ascent, 


(50, 50)) 


shifted ascent2 = ndimage.shift (ascent, (50, 50), mode="nearest") 
rotated ascent = ndimage.rotate (ascent, 30) 


[2 
bls 
.imshow (shifted ascent, cmap=pl.cm.gray) 
.figure() 

.imshow (shifted ascent2, cmap=pl.cm.gray) 
.figure() 

.imshow (rotated ascent, cmap=pl.cm.gray) 
.show() 


pl 


imshow (ascent, cmap=pl.cm.gray) 
figure () 


其 中 ，ascent = misc.ascent() 生 成 了 一 个 SciPy 库 自 带 的 灰 度 图 片 ， 语句 ndimage.shift 
(ascent, (50, 50)) 对 图 片 进行 了 平移 处 理 ， 处 理 后 的 图 片 如 图 9-1(b) 所 示 ; 语句 ndimage.shift 
(ascent，(50，50)，mode=“nearest”) 为 平移 后 自动 填充 ， 处 理 效果 如 图 9-1(c) 所 示 ; 语句 
rotated_ascent = ndimage.rotate(ascent, 30) 对 图 片 做 了 逆 时 针 旋 转 30° 的 处 理 ， 处 理 后 的 图 片 
如 图 9-1(d) 所 示 。 

我 们 知道 ， 无 论 是 方程 组 求解 ， 还 是 图 像 处 理 ， 使 用 一 般 的 高 级 语言 按部就班 地 编 


程 ， 都 需要 耗费 很 长 的 时 间 ， 编 H 
编程 与 之 不 同 ， 它 的 
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的 程序 也 很 元 长 ， 还 不 得 不 考虑 各 种 例外 情况 。Python 
念 是 尽 可 能 地 运用 各 种 第 三 方 扩展 库 ， 迅 速 开发 





符合 要 求 的 程 


序 。 从 上 面 的 两 个 例题 


显 的 编程 可 以 看 出 ， 如 何 求 方程 组 的 解 ， 如 何 对 
充 、 旋 转 等 处 理 ， 我 们 不 必 关 心 ， 
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辐 像 进行 平移 、 填 
我 们 只 关心 业务 逻辑 ， 即 关心 我 们 要 解决 的 问题 

















(©) 平移 处 理 后 的 图 片 (自动 填充 ) 


换言之 ， 用 Python 编程 ， 我 们 只 管 What to do， 


由 此 可 见 一 





Won 


INN 


Wes 


0 100 200 300 400 By 


(b) 平移 处 理 后 的 图 片 (未 自动 填充 ) 








0 310 20 30 40 500 600 


(q) 旋转 处 理 后 的 图 片 
图 9-1 使 用 SciPy 库 对 图 片 进行 处 理 


不 管 How to do，Python 编程 的 魅力 


9.3.3 Matplotlib 库 


前 两 节 主 要 介绍 了 用 了 
据 可 视 化 工具 。 所 以 ， 


Matplotlib 是 Python 


生成 出 版 质量 级 别 的 














生成 直方 图 





形 。 


、 功 率 谱 、 ea 
Matplotlib 的 安装 与 上 面 的 


F 科 学 计算 的 NumPy 库 和 SciPy 库 ， 这 两 种 库 均 未 提供 数 


这 里 我 们 引入 Matplotlib de ee 





个 2D 绘图 库 ， 它 以 各 种 硬 拷 贝 格式 和 跨 平台 的 交互 式 环境 
过 使 用 Matplotlib， 开 发 者 仅 需要 写 几 行 代码 便 可 以 绘图 ， 
错误 图 、 散 点 图 等 ， 也 可 以 绘制 一 些 简单 的 3D 图 。 

为 两 个 模块 相似 ， 同 样 可 以 使 用 pip 安装 或 者 自行 安装 ， 在 











Ubuntu 环境 下 也 可 以 通过 如 下 命令 进行 安装 : 
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sudo apt-get install Python-matplotlib 


安装 成 功 后 ， 可 以 用 如 下 命令 测试 是 否 安装 成 功 : 


import matplotlib 
print (matplotlib. version ) 


如 果 安 装 成 功 ， 则 会 显示 Matplotlib 的 版 本 号 。 
安装 成 功 Matplotlib 库 后 ， 就 可 以 借助 于 它 将 运算 结果 “ 画 ” 出 来 了 。 下 面 的 例子 将 
介绍 Matplotlib 的 一 些 基本 用 法 。 
【 例 9-7】 使 用 Matplotlib 进行 画图 的 一 些 基 本 代码 : 


import matplotlib.pyplot as plt 
import numpy as np 


= np.linspace (0，10，1000) # 设 置 自 变 量 格 式 
y= np-sin(x) + 1 二 设置 因 变 量 
Zz = np.cos (xx+*2) + 1 # 设 置 因 变量 z 


plt.figure (figsize=(8, 4)) # 设 置 图 像 大 小 
plt.plot (x, y, label="sinx+1l", color='red', linewidth=2) 
# 作 图 (x, y) ， 设 置 标签 格式 


plt.plot (x, z，label="cosx^2+1") 井 作 图 (x，z) 
plt.xlabel('"Time(s) ') 井 设 置 x 轴 名 称 
plt.ylabel('Volt') # 设 置 y 轴 名 称 
plt.title('A simple Example') 间 设 置 表 格 标题 
plt.ylim(0，2.2) # 显 示 的 y 轴 范围 

plt .legend() # 显 示 图 例 

plt.show() # 显 示 作 图 结果 


运行 上 面 的 代码 ， 会 弹出 一 个 如 图 9-2 所 示 的 窗口 。 


一 三 要 Sa 
一 三 要 Sa 


由 


A 





9-2 ”使 用 Matplotlib 画图 
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单 击 保存 图 标 ， 可 以 将 表格 保存 为 .eps、.jjpg、.pdf、.png、.raw 等 图 片 格式 。 保 存 的 
图 片 质量 几乎 可 以 满足 各 种 出 版 要 求 。 
逮 注意 : 
@ ”实际 绘图 时 ， 可 能 会 发 现 有 中 文 无 法 正常 显示 的 情况 ， 这 是 因为 Matplotlib 的 默 
认 字 体 为 英文 字体 所 致 ， 需 要 在 作 图 之 前 ， 指 定 默 认 字 体 为 中 文 。 代 码 如 下 : 
plt.rcParams[ ‘font.sans-serif ] = [‘“SimHei’] 
@ 如果 在 保存 作 图 图 像 时 发 现 负 号 显示 不 正常 ， 可 以 通过 下 面 的 代码 解决 : 


PltrcParams[ “axes.unicode minus’] = False 
【 例 9-8】 使 用 matplotlib 实现 数据 可 视 化 : 


import matplotlib.pyplot as plt 
import xlrd 





data= xlrd.open workbook ("data.xls") 
sh = data.sheet by name ("Sheet]1") 
x=sh.col values (0) 

y=sh.col values (1) 

RULE 人 

plt.show() 


上 面 的 代码 是 一 个 从 Excel 文件 中 读 取 数据 ， 并 使 用 Python 实现 数据 可 视 化 ， 其 运行 
结果 如 图 9-3 所 示 。 
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图 9-3 ”使 用 Python 进行 数据 可 视 化 


可 以 看 到 的 是 ， 使 用 Python 语言 ， 我 们 仅 通 过 短 短 几 行 代码 ， 即 可 实现 数据 的 可 视 化 
显示 ， 这 是 其 他 编程 语言 所 不 具有 的 优势 。 


9.3.4 ” Pandas 库 
Pandas 库 是 Python 下 功能 最 为 强大 的 数据 分 析 和 探索 工具 ， 也 是 本 章 介绍 的 这 些 库 中 
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最 为 重要 的 ， 它 包含 高 级 的 数据 结构 和 精巧 的 分 析 工 具 ， 使 得 在 Python 中 处 理 数据 变 得 快 


速 、 


简单 。 
Pandas 构建 在 NumPy 之 上 ， 最 初 是 作为 金融 数据 分 析 用 途 而 开发 出 来 的 ， 它 是 使 





了 Python 成 为 强大 而 高 效 的 数据 分 析 环 境 的 重要 因素 之 一 。 


Pandas 的 功能 非常 强大 ， 支 持 类 似 SQL 的 数据 增 、 删 、 改 、 查 操作 ， 并 且 包含 了 非 


常 多 的 数据 处 理 函 数 。 


Pandas 为 时 间 序 列 分 析 提 供 了 很 好 的 支持 ， 可 以 很 好 地 处 理 数据 缺失 等 问题 ， 可 以 灵 


活 地 对 齐 数据 ， 解 决 不 同 数据 源 的 数据 集成 时 常见 的 问题 。 


1. 安装 Pandas 
Pandas 的 安装 与 上 面 的 各 个 模块 相似 ， 同 样 可 以 使 用 pip 安装 或 者 自行 安装 ， 在 


Ubuntu 环境 下 也 可 以 通过 如 下 命令 进行 安装 : 


sudo apt-get install Python-pandas 
安装 成 功 后 ， 可 以 用 如 下 命令 测试 是 否 安装 成 功 : 


import pandas as pd 
print(pd. version ) 


如 果 安 装 正确 ， 则 会 显示 出 Pandas 的 版 本 号 。 
2，Pandas 的 数据 结构 Series 
Series 是 一 种 类 似 于 一 维 数组 的 对 象 ， 它 由 一 组 数据 (各 种 NumPy 数据 类 型 ) 以 及 一 组 


与 之 相关 的 数据 标签 ( 即 索 引 ) 组 成 。 


Series 的 字符 串 表 现形 式 为 : 索引 在 左边 ， 值 在 右边 。 下 面 的 例子 展示 了 创建 Series 





对 象 的 几 种 方法 。 


【 例 9-9】 创 建 Series 对 象 : 


from pandas import Series  # 从 Pandas 库 中 引用 Series 


Go el | 
Cb Eupie = (2 2 0 3 A 0 oa 

cb dict = {rTom ss [LG "Doyle Max L127 Mov le “aliats Pl 
cyl 

series list = Series (obj list) 

series tuple =Series (obj tuple, index=['a', 'b', 'c', 'd', 'e']) 
series dict = Series (obj dict) 

print (" (1) 通过 1ist 建立 Series: ") 

print (series list) 

print (" (2) 通过 tuple 建立 Series: ") 

print (series tuple) 

print (" (3) 通过 dict 建立 Series: ") 

print(tseries dict) 


输出 结果 : 
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0 USeries: 


jp eg, 
Julia [18, girl] 
Max [12, boy] 
Tom [16, boy] 
oe object 
可 以 看 到 ， 当 没有 显 式 地 给 出 索引 值 的 时 候 ，Series 从 0 开始 自动 创建 索引 。 相 对 于 
其 他 的 很 多 数据 结构 来 说 ，Series 结构 最 重要 的 一 个 功能 是 它 可 以 在 算术 运算 中 自动 对 齐 


不 同 索引 的 数据 。 
【 例 9-10】Series 的 自动 对 齐 功能 : 


from pandas import Series 从 Pandas 库 中 引用 Series 


obj dict = {" 王 明 ": 7700，" 张 伟 ": 8600，" 赵 红 ": 9100，" 郭 强 ": 6700} 
series obj 1 = Series (obj dict) 

series obj 2 = Series (obj dict，index=[' 张 伟 :， ' 郭 强 '，' 王 明 '，' 李 洋 ]) 
print (series obj 1) 

和 二 二 三 二 二 = 二 二 | 

print (series obj 2) 

PelnE (======S=e===== ba 

print (series obj l+series obj 2) 


i 7700 

9100 

和 6700 
张 8600.0 
郭 6700.0 
让 7700.0 
> NaN 
dtype: float64 


张 伟 17200.0 
> NaN 
15400.0 
a 
13400.0 
SR float64 
从 上 面 的 例子 中 可 以 看 到 ， 在 建立 series_obj 2 时 ，obj_dict 中 跟 索 引 值 相 匹配 的 值 会 
被 找 出 来 赋 给 相应 的 索引 ， 而 “李洋 ” 没 在 obj_dict 中 ， 所 以 对 应 的 值 被 赋 为 NaN(Not a 
Number)， 即 缺失 值 。 在 执行 series obj 1 + series_obj 2 时 ，Series 对 象 自动 对 齐 不 同 的 索 
引 值 再 进行 计算 。 
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3. Pandas 的 数据 结构 DataFrame 


DataFrame 是 Pandas 的 主要 数据 结构 之 一 ， 是 一 种 带 有 标签 的 二 维 对 象 ， 与 Excel 表 
格 或 者 关系 型 数据 库 的 结构 十 分 相似 。DataFrame 结构 的 数据 都 会 有 一 个 行 索引 和 列 索 
引 ， 且 每 一 列 的 数据 格式 可 能 是 不 同 的 。 相 对 于 Series 来 说 ，DataFrame 相当 于 多 个 带 有 
相同 索引 的 Series 的 组 合 ， 且 每 个 Series 都 有 一 个 不 同 的 表 头 来 识别 不 同 的 Series。 

【 例 9-11】 创 建 DataFrame: 


from pandas import DataFrame 提 从 pandas 库 中 引用 DataFrame 
from pandas import Series # 从 pandas 库 中 引用 Series 





obj = {'name': ['Tom', 'Peter', 'Lucy', 'Max', 'Anne'], 'age': ['17', 
oe pi Cr ey 

vstatus": "student'r Student "doctor”s clerk "porformer]lt 
series dictl = Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e']) 
series dict2 = Series([6, 7, 8, 9, 10], index=['a', 'b', 'c', 'd', 'e']) 
df obj = DataFrame (obj) # 创 建 DataFrame 对 象 
df obj2 = DataFrame ([series dictl, series dict2]) 
print (df obj) 


Prane( = -i 
print (df _ obj2) 
输出 结果 : 

age name status 
Dol Tom student 
1 23 Peter student 
2 44 Lucy doctor 
a. 27 Nax clerk 
4 36 Anne performer 

a 
[1 (Oe ,1 

6 7 8 9 10 


本 例 程序 通过 传 入 一 个 NumPy 数组 组 成 的 字典 来 创建 DataFrame 对 象 ， 这 是 最 为 常 
用 的 方法 。 也 可 以 利用 多 个 具有 相同 索引 的 Series 对 象 来 创建 DataFrame 对 象 ， 不 过 ， 创 
建 出 的 列表 只 能 为 横向 列表 。 使 用 df_obj.T 转 置 方法 可 将 其 转换 成 常用 的 纵向 列表 。 

通过 使 用 类 似 于 访问 类 成 员 的 方式 ， 可 以 获取 DataFrame 对 象 指 定 的 列 数 据 (Series) 或 
者 新 增 列 。 

【 例 9-12】DataFrame 的 基本 操作 : 


from pandas import DataFrame  # 从 Pandas 库 中 引用 DataFrame 
from pandas import Series # 从 Pandas 库 中 引用 series 


ob =s. {name [Tom', "Peter”, TUucy™, 到 3 区 人 DR 32 LET 
i he a 

"status': ['student', 'student', 'doctor', 'clerk', "performer']} 
Sories odietl = "96mesOll 2 3 A S51 LNGxs Dav "DE Me Jd vor 
onlies dict2 = Soniea(l6 7 BB, So Lol index=T a Bo tev vd erly 
df obj = DataFrame (obj) # 创 建 DataFrame 对 象 
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df obj2 = DataFrame ([series dictl,series dict2]) 


print ("--- 查 看 前 几 行 数据 ， 默 认 5 行 ---") 
print (df obj.head () ) 


[四 ( 人 人 提取 二 到 = 一 =。 my 
print (df obj .age) 
print ("———————-——— 添加 列 ---------- 一 - ey 


dr obil gender lm nn VE) 
print (df obj) 

PEIN = 一 = ") 

del df obj['status'] 

print (df obj) 


print ("-————————-——— 转 置 ------------- 轴 ) 
Print (df _ obj2.T) 
输出 结果 : 

-一 查看 前 几 行 数据 ， 默 认 5 行 一 - 


age name status 
hu Tom student 
1 23 Peter student 
FE 44 Lucy doctor 
4 





27 Nax clerk 
36 Anne performer 
一 -一 提取 一 列 -一 一 
0 17 
1 23 
2 44 
3 27 
d hb 
ane: age, dtype: object 
TE 
age name status gender 
0 17 Tom student nm 
1 23 Peter student n 
2 44 Lucy doctor 本 
3 27 Max clerk m 
4 36 Anne performer f 
-一 一 一 腹 除 列 ------------ 
age name gender 
0 Tom mM 
1 23 Peter m 
2 44 Lucy 
3 27 Max m 
4 36 Anne 放 
站 转 轩 一 一 一- 一 
0 1 
[0 0 
b2 7 
c3 8 
dad4 9 
e 5 10 
>>>1 


还 有 一 些 其 他 的 常用 DataFrame 操作 ， 如 表 9-3 所 示 。 

本 书 第 5 章 介绍 了 用 Python 读 取 CSV、Excel 文件 的 方法 ， 但 需要 特别 指出 的 是 ， 
Pandas 也 可 以 从 Excel、CSV 等 文件 中 读 取 或 写 入 数据 。 不 过 默认 的 Pandas 库 并 不 能 直接 
对 Excel 文件 进行 操作 ， 还 需要 安装 xlrd( 读 入 操作 ) 和 xlwt( 写 入 操作 ) 库 才能 支持 对 Excel 
文件 的 读 写 。 安 装 xlrd 和 xlwt 库 的 方法 如 下 : 

pip install xlrd 

pip install xlwt 


安装 完成 后 ， 就 可 以 在 Pandas 中 进行 Excel、CSYV 等 文件 的 操作 了 。 
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df obj2 = DataFrame ([series dictl,series dict2]) 


print ("--- 查 看 前 几 行 数据 ， 默 认 5 行 ---") 
print (df obj.head () ) 


[四 ( 人 人 提取 二 到 = 一 =。 my 
print (df obj .age) 
print ("———————-——— 添加 列 ---------- 一 - ey 


dr obil gender lm nn VE) 
print (df obj) 

PEIN = 一 = ") 

del df obj['status'] 

print (df obj) 


print ("-————————-——— 转 置 ------------- 轴 ) 
Print (df _ obj2.T) 
输出 结果 : 

-一 查看 前 几 行 数据 ， 默 认 5 行 一 - 


age name status 
hu Tom student 
1 23 Peter student 
FE 44 Lucy doctor 
4 





27 Nax clerk 
36 Anne performer 
一 -一 提取 一 列 -一 一 
0 17 
1 23 
2 44 
3 27 
d hb 
ane: age, dtype: object 
TE 
age name status gender 
0 17 Tom student nm 
1 23 Peter student n 
2 44 Lucy doctor 本 
3 27 Max clerk m 
4 36 Anne performer f 
-一 一 一 腹 除 列 ------------ 
age name gender 
0 Tom mM 
1 23 Peter m 
2 44 Lucy 
3 27 Max m 
4 36 Anne 放 
站 转 轩 一 一 一- 一 
0 1 
[0 0 
b2 7 
c3 8 
dad4 9 
e 5 10 
>>>1 


还 有 一 些 其 他 的 常用 DataFrame 操作 ， 如 表 9-3 所 示 。 

本 书 第 5 章 介绍 了 用 Python 读 取 CSV、Excel 文件 的 方法 ， 但 需要 特别 指出 的 是 ， 
Pandas 也 可 以 从 Excel、CSV 等 文件 中 读 取 或 写 入 数据 。 不 过 默认 的 Pandas 库 并 不 能 直接 
对 Excel 文件 进行 操作 ， 还 需要 安装 xlrd( 读 入 操作 ) 和 xlwt( 写 入 操作 ) 库 才能 支持 对 Excel 
文件 的 读 写 。 安 装 xlrd 和 xlwt 库 的 方法 如 下 : 

pip install xlrd 

pip install xlwt 


安装 完成 后 ， 就 可 以 在 Pandas 中 进行 Excel、CSYV 等 文件 的 操作 了 。 
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表 9-3 其 他 的 常用 DataFrame 操作 




















操 作 说 明 
df obj.dtypes 查看 各 行 的 数据 格式 
df obj.tail) 查看 后 几 行 的 数据 ， 默 认 后 5 行 
df obj.index 查看 索引 
df obj.columns 查看 列 名 
df obj.values 查看 数据 值 
df obj.describe 描述 性 统计 
df obj.sort(columns = “*) 按 列 名 进行 排序 
df obj.sort values 多 列 排序 
f_obj[* 列 索引 ”] 显示 列 名 下 的 数据 
df obj[1:3]# 获取 1~3 行 的 数据 (切片 操作 ) 
df objreindex0 根据 index 参数 重新 进行 排序 


【 例 9-13】 读 入 Excel 文件 : 


import pandas as pd 


df obj = pd.read excel('sult.xls') 
print (type (df obj)) 
print (df _obj.head()) 


输 出 结 昌 。 
JE 
《class ” a core. frame. DataFrame” > 可 
P+(nY) lgC+(mA) 10nY 区 间 斜 率 ”50nmyY 区 间 平均 斜率 
0 -120.0 0.352260 1222.163105 1192. 456669 
1 -110.0 0.360442 1401.030899 1111.419158 
2 -100.0 0.367580 761.145713 ”983. 230411 
3 -90.0 0.380718 1394.644111 965.479118 
4 站 0 0.387888 1183.299518 808.467750 
这 


9.4 案例 实 训 


本 节 通 过 两 个 案例 介绍 利用 Python 进行 数据 分 析 的 一 些 基本 方法 ， 配 以 实际 的 数据 进 
行 讲解 。 


9.4.1 利用 Python 分 析 数 据 的 基本 情况 
一 一 缺失 值 分 析 与 数据 离散 度 分 析 


实际 的 数据 挖掘 过 程 中 ， 通 过 分 析 从 客户 手中 得 到 的 数据 会 发 现 ， 由 于 各 种 各 样 的 原 
因 ， 得 到 的 数据 有 一 部 分 是 缺失 的 。 如 果 缺 失 的 数据 量 不 大 ， is 
事 ， 但 实际 情况 往往 相反 ， 庞 大 的 数据 量 和 较 多 的 属性 值 ， 依 靠 人 工分 辨 的 方法 是 非常 
切实 际 的 。 所 以 ， 拟 通过 使 用 Python 编写 程序 来 帮助 检测 数据 的 缺失 值 、 wwe 
属性 。 利 用 Pandas 库 中 的 describe0 函 数 ， 可 以 将 数据 读 入 程序 ， 轻 松 地 完成 上 述 操作 。 
例如 ， 现 有 如 图 9-4 所 示 的 日 期 /销量 Excel 表格 。 
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A A B 

工 日 期 销 笃 

| 2015/3/1 51 
3 2015/2/28 2618.2 
和 4 2015/2/27 2608.4 
| 2015/2/26 2651.9 
6 2015/2/25 3442.1 
| 3393.1 
8 3136.6 
9 3744.1 
0 6607.4 
也 | 4060.3 
到 2015/2/19 3614.7 
13| 2015/2/18 3295.5 
14) 2015/2/16 2332.1 
15 2015/2/15 2699.3 





16 2015/2/14 





3036.8 


9-4 “日 期 /销售 额 Excel 表格 
若 使 用 Python 对 数据 的 基本 情况 进行 分 析 ， 可 使 用 下 面 的 程序 : 


import pandas as pd 


print (" 例 : 使 用 Python 分 析 数 据 基 本 信息 。") 
BEAnE( = ===>= = == ====== 人 
while True: 
print (" 请 输入 数据 文件 所 在 路 径 :") 
sale data = input() # 获 取 数 据 路 径 
Ls 
data = pd.read excel (sale data, index col=" 旧 出 吃 


# 读 取 数 据 ， 指 定 “ 日 期 ” 列 为 索引 


print (data.describe()) 
break 
except: 


print ("文件 打开 失败 ， 请 确认 路 径 ") 
运行 上 面 的 代码 ， 输 出 结果 如 下 : 


请 输入 数据 文件 所 在 路 径 : 


catering_sale.xls 


count 200.000000 
mean 2755.214700 
std 751. 029772 
min 22. 000000 
25% 2451.975000 
50% 2655.850000 
75% 3026.125000 
max 9106.440000 
>>>1 


其 中 ，count 表示 的 是 非 空 数据 总 数 ， 通 过 对 比 len(data) 的 值 可 以 得 出 缺失 值 的 个 数 。 
其 他 的 几 个 值 分 别 为 数据 平均 值 (mean)、 标 准 差 (std)、 最 小 值 (min)、 下 四 分 位 数 (25%)、 中 
位 数 (50%)、 上 四 分 位 数 (75%) 和 最 大 值 (max)。 在 这 7 个 数 中 ， 前 两 个 数 反映 了 数据 的 中 心 
趋势 ， 后 5 个 数 反 映 了 数据 的 离散 度 ， 在 数理 统计 中 称 为 “五 数 概括 ”。 
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9.4.2 ”使 用 箱 形 图 检测 异常 值 一 一 离 群 点 挖掘 


异常 值 指 的 是 样本 数据 中 个 别 明显 偏离 实际 的 点 ， 亦 称 离散 点 或 孤立 点 ， 因 此 异常 值 
分 析 也 叫 作 离 群 点 分 析 或 孤立 点 分 析 。 

对 数据 进行 异常 值 分 析 是 为 了 检测 数据 中 是 否 有 录入 错误 或 者 不 合乎 常理 的 数据 。 这 
些 异 常 的 数值 在 后 续 数据 挖掘 中 往往 是 十 分 危险 的 ， 极 有 可 能 造成 数据 扭曲 。 

这 意味 着 ， 如 果 不 加 剔除 地 使 用 这 些 异 常 值 ， 最 后 数据 挖掘 得 到 的 结果 可 能 和 实际 大 
相 径 庭 。 同 时 ， 挑 出 这 些 异 常 的 数值 并 对 其 进行 分 析 ， 也 往往 可 以 成 为 数据 挖掘 的 突破 口 
(如 欺诈 甄别 等 )。 

箱 形 图 (box-plob 又 称 为 盒 型 图 、 盒 式 图 、 盒 图 或 箱 线 图 ， 是 用 来 显示 一 组 数据 离散 情 
况 的 统计 图 。 

箱 形 图 提供 了 一 个 用 于 识别 异常 值 的 标准 异常 值 被 定义 为 小 于 Q1-1.5IQR 或 大 于 
Q3+1.5IQR 的 值 ， 其 中 ，Q1 表示 下 四 分 位 数 ， 全 部 数据 有 四 分 之 一 小 于 这 个 值 ， 四 分 位 
距 (Inter Quartile Range，IQR) 表 示 四 分 位 数 间 距 ， 是 上 四 分 位 数 和 下 四 分 位 数 之 差 ， 包 含 
了 全 部 数据 的 一 半 ;Q3 表示 上 四 分 位 数 ， 全 部 数据 有 1/4 大 于 这 个 值 。 

绘制 箱 形 图 依靠 的 是 实际 数据 ， 不 需要 事先 假定 数据 服从 某 种 特定 的 分 布 形式 ， 也 不 
必 对 数据 做 任何 限制 性 要 求 ， 它 只 是 真实 、 直 观 地 表现 数据 形状 的 本 来 面貌 ， 另 一 方面 ， 
箱 形 图 判断 异常 值 的 标准 以 四 分 位 数 和 四 分 位 距 为 基础 ， 四 分 位 数 具 有 一 定 的 耐 抗 性 ， 多 
达 25% 的 数据 可 以 变 得 任意 远 而 不 会 很 大 地 扰动 四 分 位 数 ， 所 以 异常 值 不 会 对 这 个 标准 施 
加 影响 。 箱 形 图 识别 异常 值 的 结果 比较 客观 ， 因 此 ， 它 在 识别 异常 值 方面 有 一 定 的 优越 
性 。 图 9-5 是 箱 形 图 的 示意 图 。 








和 一 离 群 点 
上 界 





上 四 分 位 





中 位 数 





下 四 分 位 


一 一 一 一 下 界 
e 一 一 一 一 一 一 高 群 点 


图 9-5 箱 形 图 示意 图 
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假定 用 于 分 析 的 数据 包含 属性 age， 其 值 如 下 ( 按 递 增 序 ): 13, 15, 16, 16, 19. 20, 20, 21, 


22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46. 52, 70。 使 用 箱 形 图 检测 离 群 点 
的 程序 如 下 : 


import pandas as pd 
from pandas import DataFrame 
import matplotlib.pyplot as plt # 导 入 图 像 库 


Vem re T0120 20 2 722.2 250 758020 700 3093 
S33 2350 .350 35 35. 36.0 40 49 52 70 
data = DataFrame (value) 


plt .figure() # 建 立 图 像 


p = data.boxplot (return type='dict') # 画 箱 形 图 ， 直 接 使 用 DataFrame 的 方法 
x = p['fliers'] [0] .get xdata() #"flies' 即 为 异常 值 的 标签 


y= pl'fliers'] [0] .get ydata() 
Y.sort () # 从 小 到 大 排序 ， 该 方法 直接 改变 原 对 象 
# 用 annotate 添加 注释 
# 其 中 有 些 相近 的 点 ， 注 解 会 出 现 重 瑚 ， 难 以 看 清 ， 需 要 一 些 技巧 来 控制 。 
# 以 下 参数 都 是 经 过 调试 的 ， 需 要 具体 问题 具体 调试 
for i in range(len(x)): 
EE SO 
plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]- 
VE 
SLse> 
plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i])) 
plt .show() # 展 示 箱 形 图 


运行 上 面 的 代码 ， 会 显示 出 如 图 9-6 所 示 的 箱 形 图 。 在 图 中 ， 一 个 离 群 点 70 被 明显 地 


标 出 。 在 实际 问题 中 ， 实 验 数据 量 特别 巨大 时 ， 使 用 箱 形 图 可 以 帮助 我 们 快速 地 找 出 所 有 
的 离 群 点 。 























图 9-6 ” 离 群 点 挖掘 实例 一 一 箱 形 图 


:{271\. 


mm Python 程序 设计 实用 教程 


本 章 9.1 节 曾 提 及 ， 数 据 挖掘 的 最 后 一 个 步骤 是 知识 表示 ， 一 般 使 用 可 视 化 的 方式 表 
示 ， 以 适合 不 同 背景 用 户 的 需要 。 

针对 本 例 而 言 ， 使 用 箱 形 图 表示 离 群 点 ， 其 本 身 就 是 数据 的 可 视 化 。 不 难看 出 ， 数 理 
统计 中 反映 数据 离散 特征 的 “五 数 概括 ”在 这 里 以 可 视 化 的 方式 进行 了 非常 形象 的 表示 ， 
展示 了 数据 的 分 布 趋势 。 


本 章 小 结 


由 于 篇 幅 所 限 ， 本 章 只 是 简单 地 介绍 了 Python 在 数据 挖掘 方面 的 简单 应 用 ， 向 读者 介 
绍 了 用 于 数据 分 析 与 数据 挖掘 的 NumPy 库 、SciPy 库 、Pandas 库 、Matplotlib 库 等 ， 并 简 
单 地 展示 了 如 何 使 用 Python 实现 数据 的 可 视 化 。 目 前 使 用 Python 进行 数据 挖掘 十 分 热 
门 ， 读 者 如 果 对 本 节 内 容 感 兴趣 ， 可 以 参考 《利用 Python 进行 数据 分 析 》 一 书 (参考 文献 
[1])， 里 面 对 NumPy 库 和 Pandas 库 有 着 详细 的 介绍 。 


习题 


1. 填空 题 
(1) SciPy 库 依赖 于 ( ) 库 ， 因 此 在 安装 SciPy 库 之 前 需要 先 安 装 好 它 。 
(2) 欲 生成 由 0，1，2，...，8 组 成 的 3 行 3 列 数组 ， 请 完善 下 面 的 程序 : 


import numpy as np 
data = 
arr = 


(3) 请 将 下 面 的 代码 补 全 ， 并 写 出 运行 结果 : 








sl = Series([7.3, -2.5, 3.4, 1.5],index = ["a","c","d","e"]) 
s2 Seriostl-2 1 36 = 5 i na = 
print (sl+s2) 


2. 选择 题 
(1) 下 面 代码 的 输出 结果 为 ( ): 


import numpy as np 
arr3 = np-eye(3) 
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A.[[1.0.0] B. [[0.0.0] © D. [[1.0.0] 
[0.1.0] [0.0.0] [E11] [0.2.0] 
[0.0.1]] [0.0.0]] [1.1.1]] [0.0.3]] 

(2) 对 DataFrame 对 象 进行 操作 时 ， 下 面 ( 。 ) 语 句 可 实现 查看 前 面 5 行 数据 的 功能 ? 

A. DataFrame.align B. DataFrame.age 

C. DataFrame.head D. DataFrame.shape 

3. 实验 操作 题 


(1) 使 用 NumPy 库 生 成 一 个 由 0~14 组 成 的 3 行 5 列 的 数组 。 

(2) 使 用 NumPy 库 计算 数组 [[1,1], [0.1]] 乘 以 数组 [[2.0]. [3.4]] 的 结果 并 输出 。 

(3) 使 用 Pandas 库 对 数组 [[1,2,3,4,5],[6.7,8,9,10]] 以 0、1 为 行 号 ， 以 字母 为 列 号 建立 
索引 ， 并 输出 运行 结果 和 转 置 后 的 结果 。 

(4) 现 有 和 矩阵: 

EF 2 | 

2 2 

3 4 3 

利用 SciPy 库 求 矩 阵 的 北 ， 并 写 出 代码 和 输出 结果 。 

(5) 从 0 开始 ， 步 长 值 为 1 或 者 -1， 且 出 现 的 概率 相等 ， 通 过 使 用 Python 内 置 的 
random 实现 1000 步 的 随机 漫步 ， 并 使 用 Matplotlib 生成 折线 图 。 


.{273\. 


第 10 童 


GUI 编程 和 用 户 开 面 


mm Python 程序 设计 实用 教程 


本 章 要 点 

(1) GUI 界面 的 概念 。 

(2) Tkinker 模块 。 

(3) Tkinker 的 各 种 组 件 。 

(4) 网 格 布局 管理 器 。 

(5) GUI 编程 。 

学 习 目 标 

(1) 了 解 什么 是 GUI 界面 。 

(2) 掌握 Tkinker 及 其 各 个 组 件 的 应 用 方法 。 
(3) 掌握 网 格 布局 管理 器 的 相关 知识 。 
(4) 掌握 GUI 编程 方法 。 


前 面 各 章 的 程序 都 是 基于 文本 用 户 界 面 (Text-based User Interface，TUD 的 。 当 然 ，TUI 
界面 有 着 简洁 、 稳 定 、 资 源 消耗 较 小 等 优点 ， 但 是 ， 对 于 不 懂 编 程 的 用 户 来 说 ，TUI 界面 
显得 不 甚 美观 ， 操 作 也 不 甚 方便 。 为 了 使 输入 输出 更 加 直观 ， 使 操作 方式 更 加 简易 ， 就 需 
要 使 用 图 形 用 户 界 面 (Graphical User Interface，GUD， 或 称 图 形 用 户 接口 。 

图 形 用 户 界面 是 人 与 计算 机 通信 的 一 种 界面 显示 格式 ， 人 允许 用 户 使 用 鼠标 等 输入 设备 
操纵 屏幕 上 的 图 标 或 菜单 选项 ， 以 选择 命令 、 调 用 文件 、 启 动 程序 或 执行 其 他 一 些 任务 。 
与 通过 键盘 输入 文本 或 字符 命令 来 完成 例 行 任务 的 文本 界面 相 比 ， 图 形 用 户 界面 有 许多 优 
点 。Python 提供 了 很 多 的 GUI 界面 工具 ， 如 Python 的 标准 Tk GUI 工具 包 接 口 Tkinter、 
wxWidgets 模块 、easyGUI 模块 、wxPython 模块 等 。 本 章 主要 介绍 使 用 Tkinter 模块 开发 图 
形 用 户 界 面 的 方法 ， 并 介绍 一 些 常用 的 Tkinker 组 件 。 根 据 实 际 情况 选择 合适 的 模块 来 实 
现 所 需 的 功能 ， 也 是 减少 编程 工作 量 必 不 可 少 的 方法 。 


10.1 Tkinter 模块 


Tkinter 模块 (Tk 接口 ) 是 Python 的 标准 Tk GUI 工具 包 的 接口 。Tk 和 Tkinter 可 以 在 大 
多 数 Unix 平台 下 使 用 ， 当 然 也 可 以 应 用 在 Windows 和 Macintosh 系统 里 。 图 10-1 所 示 的 
是 一 个 简单 的 房屋 按揭 利率 计算 器 ， 这 一 程序 有 三 个 用 户 输入 项 和 一 个 输出 项 。 图 10-1(a) 
是 TUI 程序 及 其 输出 结果 ， 图 10-1(b) 是 使 用 Tkinter 控件 的 GUI 输入 输出 界面 。 

在 图 10-1(b) 的 界面 中 有 三 个 白色 的 输入 文本 框 ， 用 户 可 以 在 输入 文本 框 中 单 击 鼠 标 ， 
输入 新 的 数据 或 者 更 改 现 有 的 数据 。 在 输入 完 所 有 的 数据 后 ， 单 击 界面 下 方 的 “计算 每 月 
应 还 款 金额 ”按钮 ， 就 会 将 数据 提交 给 程序 并 计算 出 相应 的 还 款 金 额 ， 并 显示 在 下 面 的 框 
体 中 。 图 中 的 文本 框 称 为 输入 框 控 件 (Entry Widget)， 左 边 显示 的 文本 信息 称 为 标签 控件 
(Label Widget)， 下 面 的 提交 按钮 称 为 按钮 控件 (Button Widget)。 

除了 这 些 控件 ，Tkinter 还 提供 了 诸如 列表 框 组 件 、 画 布 组 件 、 复 选 框 组 件 、 菜 单 组 件 
等 ， 本 章 后 面 将 对 其 做 详细 介绍 。 

为 了 术语 的 统一 ， 以 下 我 们 将 “组 件 ” 和 “控件 ”统称 为 “组 件 ”。 
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def main() : 


# 房 货 M/ 旬 短 请 输入 贷款 金额 : 300000 
Principal = float (input (“请 输入 贷款 金额 :“)) 请 输入 贷款 利率 (%) :5.51 
year_rate = float (input (“请 输入 贷款 利率 (%):“)) 请 输入 贷款 期 限 (年 ) : 10 
month rate = year rate/12 几 姑 散 成 采 刑 素 每 月 应 还 款 金额 : 3257.28 


years = float (input (“请 输入 贷款 期 限 (年 ):“)) 
months = years * 12 # 姑 藤 成 万 阁 
sum = (Principal * (month rate/100) * pow((1 + 
month rate/100), months))\ 
/ (pow((l + month rate/100),months)-1) # 万 
偿 新 太 介 公元 
print (“每 月 应 还 款 金额 : ”+“%. 2f”%sum) 











main() 


(a) TUI 界面 


贷款 全 额 , 
贷款 年 利率 ( 百分数 ) : |5.51 





3257.28 





(b) GUI 界面 
10-1 TUI 界面 与 GUI 界面 的 比较 


10.1.1 创建 Windows 窗 体 
在 GUI 程序 中 ， 首 先 需要 建立 一 个 项 层 窗口 ， 这 个 顶层 窗口 可 以 容纳 所 有 的 小 窗口 对 
象 ， 如 标签 、 按 钮 、 列 表 框 等 。 也 就 是 说 ， 顶 层 窗口 是 用 来 放置 其 他 窗口 或 组 件 的 地 方 。 
1. 创建 窗口 对 象 
用 下 面 的 语句 可 以 创建 一 个 顶层 窗口 ， 或 者 叫 根 窗口 (有 的 文献 称 为 主 窗口 ): 


import tkinter 
win = tkinter.Tk() 


其 中 第 一 行 代码 用 于 导入 Tkinter 模块 ， 第 二 行 代码 用 于 创建 一 个 Windows 窗 体 实例 
对 象 并 命名 为 win。 在 窗 体 对 象 创建 完成 后 ， 可 以 使 用 以 下 的 代码 来 显示 窗 体 : 


win.mainloop() 


同时 ，mainloopO 函 数 将 进入 无 限 监听 事件 循环 ， 直 到 单 击 窗 体 右上 方 的 关闭 按钮 ， 
或 者 使 用 其 他 方法 将 窗口 关闭 。 
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【 例 10-1】 显 示 一 个 Windows 窗 体 : 


import tkinter 
win = tkinter.Tk() 
win.mainloop() 


运行 程序 后 ， 会 显示 图 10-2 所 示 的 窗口 。 

2. 设置 窗 体 属性 

可 以 通过 设置 窗 体 的 属性 来 改变 窗 体 的 显示 方式 。 创 建 完 窗 体 对 象 后 ， 可 以 用 title0 
方法 来 设置 窗口 的 标题 ， 如 下 面 的 例子 。 

【 例 10-2】 设 置 窗口 标题 : 


import tkinter 

win = tkinter.Tk() 
win.title(" 新 建 窗口 ") 
win.mainloop () 


运行 代码 后 ， 会 显示 图 10-3 所 示 的 有 标题 的 窗口 。 























1 tk  - 口 配 下 4 新建 审 口 - 口 医 到 
图 10-2 一 个 Windows 窗口 图 10-3 有 标题 的 窗口 


还 可 以 通过 内 建 的 geometry0、maxsize0 和 minsize0 方 法 设置 窗口 的 大 小 。 

geometry(size) 方 法 设置 窗 体 大 小 ，size 为 指定 的 大 小 ， 其 中 ，size 的 格式 为 “宽度 x 
高 度 ”( 注 意 ， 这 里 的 “x” 不 是 乘 号 ， 而 是 英文 字母 )，maxsize0 和 minsize() 方 法 用 于 设置 
最 大 窗 体 和 最 小 窗 体 的 尺寸 ， 格 式 如 下 : 

win.geometry ("宽度 x 高 度 ") 


win .maxsize (宽度 ， 高 度 ) 
win.minsize (宽度 ， 高 度 ) 


【 例 10-3】 设 置 Windows 窗口 尺寸 : 


import tkinter 

win = tkinter.Tk() 
win.geometry("1024x768") 
win.minsize(800,600) 
win.maxsize (1440,900) 
win.mainloop() 
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本 例 显示 了 一 个 Windows 窗口 ， 将 其 初始 大 小 设置 为 1024x768， 并 设置 最 小 为 
800x600， 最 大 为 1440x900。 


10.1.2 标签 组 件 Label 


Label 组 件 是 最 简单 的 组 件 之 一 ， 用 于 在 窗口 中 显示 文本 或 位 图 。 下 面 就 是 一 个 使 用 
Label 组 件 的 简单 例子 。 

【 例 10-4】 使 用 Label 创建 一 个 标签 : 

import tkinter 

win = tkinter.Tk() 

win.title ("新 建 窗口 ") 

Lab = tkinter.Label (win, text="label 组 件 使 用 例子 ") 

Lab.pack () 

win.mainloop() 
在 上 面 的 例子 中 ， 首 先 创建 一 个 窗 体 ， 然 后 通过 如 下 语句 创建 Label 组 件 并 设置 显示 
的 文本 : 

Label 对 象 = Label (tkinter Windows 窗口 对 象 ，text= 要 显示 的 文本 ) 


然后 ， 通 过 .pack() 方 法 显示 Label 组 件 。 运 行 上 面 的 代码 ， 将 会 弹出 一 个 如 图 10-4 所 
示 的 窗口 。 





























4 新建 窗口 一 口 
label 组 件 使 用 例子 


图 10-4 一 个 label 组件 


除了 显示 文本 外 ， 还 可 以 运用 Label 组 件 的 bitmap 属性 在 窗口 中 显示 自 带 的 位 图 。 代 
码 如 下 : 
L = Label (win，bitmap= 图 标 ) 
其 中 “图 标 ” 的 可 选 值 如 表 10-1 所 示 。 
表 10-1 可 选用 位 图 
































值 具体 描述 

Error 显示 错误 图 标 

Hourglass 显示 沙漏 图 标 

Info 显示 信息 图 标 

Questhead 显示 疑问 头像 图 标 

Question 显示 疑问 图 标 

Warning 显示 警告 图 标 

grayl2 显示 灰 度 背景 图 标 gray12 
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续 表 
具体 描述 











【 例 10-S】 显 示 所 有 的 可 选 位 图 : 


import tkinter 
win = tkinter.Tk() 井 创 建 窗口 对 象 
win.title ("新 建 窗口 ") # 设 置 窗口 标题 


11 = tkinter.Label (win,bitmap='error') 间 显 示 错 误 图 标 

11.pack() # 显 示 Label 组 件 

12 = tkinter.Label (win,bitmap='hourglass') 间 显 示 沙 漏 图 标 
12.pack() # 显 示 Labe2 组 件 

13 = tkinter.Label (win,bitmap='info') 间 显 示 信息 图 标 

13.pack() # 显 示 Labe3 组 件 

14 = tkinter.Label (win,bitmap='questhead') ## 显 示 疑 问 头像 图 标 
14.pack() # 显 示 Iabe4 组 件 

15 = tkinter.Label (win,bitmap='question') # 显 示 疑 问 图 标 
15.pack() # 显 示 Iabe5 组 件 

16 = tkinter.Label (win,bitmap='warning') # 显 示警 告 图 标 
16.pack() # 显 示 Labe6 组件 

17 = tkinter.Label (win,bitmap='gray12') # 显 示 灰 度 背 景 图 标 gray12 
17.pack() # 显 示 Labe7 组 件 

18 = tkinter.Label (win,bitmap='gray25') 间 显 示 灰 度 背 景 图 标 gray25 
18.pack() 间 显 示 Labe8 组 件 

19 = tkinter.Label (win,bitmap='gray50') <# 显 示 灰 度 背 景 图 标 gray50 
19.pack() # 显 示 Labe9 组 件 

110 = tkinter.Label (win,bitmap='gray75') # 显 示 灰 度 背 景 图 标 gray75 
110.pack() # 显 示 Label10 组 件 

win.mainloop() 


运行 后 会 显示 如 图 10-5 所 示 的 窗口 。 
7? saEn - 口 医 司 


iD 别 一 因 O 


图 10-5 显示 可 选 位 图 的 窗口 
由 于 内 置 的 位 图 个 数 有 限 ， 而 且 显 示 的 都 是 灰 度 图 ， 所 以 ， 在 实际 的 应 用 中 ， 往 往 会 
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选择 一 些 自 定义 的 图 标 。 这 时 ， 可 以 运用 image 属性 和 bm 属性 来 设置 自 定义 的 图 标 ， 代 
码 如 下 : 


import tkinter 

win = tkinter.Tk() 间 创 建 窗口 对 象 
win.title(" 新 建 窗口 ") # 设 置 窗口 标题 
bm = tkinter.PhotoImage (file = 图 片 名 ) 
label = tkinter.Label (win,image = bm) 
label .bm = bm 


【 例 10-6】 使 用 label 的 image 属性 添加 自 定义 图 标 : 


import tkinter 

win = tkinter.Tk() 间 创 建 窗口 对 象 
win.title(" 新 建 窗 口 ") ## 设 置 窗口 标题 

bm = tkinter.PhotoImage (file = 
"D:\Python34\Lib\idlelib\Icons\idle 48.png") 
label = tkinter.Label (win, image = bm) 

label .bm = bm 

label .pack () 

win.mainloop() 


运行 上 面 的 程序 ， 可 以 看 到 ， 窗 口中 已 经 显示 出 自 定义 的 图 标 ， 如 图 10-6 所 示 。 
4 新 建 窗口 一 口 
加 





























图 10-6 添加 自 定义 图 标的 窗口 
除 上 面 介绍 的 几 个 具体 方法 外 ，Label 组 件 还 有 一 些 常 用 的 属性 ， 如 表 10-2 所 示 。 
表 10-2 Label 组 件 的 常用 属性 











属 性 说 明 

你 设置 组 件 的 前 景色 

bg 设置 组 件 的 背景 色 

width 设置 组 件 宽度 

height 设置 组 件 高 度 
设置 文本 或 图 像 如 何在 Label 上 显示 ， 默 认 值 为 None。 
当 指 定 image/bitmap 时 ， 本 文 (texb 将 会 被 覆盖 ， 只 显示 图 像 。 可 选 值 如 下 。 
Left: 图 像 居 左 显 示 。 

compound Right: 图 像 居 右 显示 


Top: 图 像 居 上 显示 。 
Bottom: 图 像 居 下 显示 
Center: 图 像 居中 显示 
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续 表 
属 性 说 明 

wraplength 指定 单行 文本 的 长 度 ， 用 于 多 行文 本 显示 
justify 指定 多 行文 本 的 对 齐 方 式 

指定 文本 或 图 片 在 Label 中 的 显示 位 置 。 可 选 值 如 下 。 

e: 垂直 居中 ， 水 平 居 右 。 

w: 垂直 居中 ， 水 平 居 左 。 
anchor n: 垂直 居 上 ， 水 平 居中 。 


s: 垂直 居 下 ， 水 平 居中 。 
也 可 是 上 面 4 个 值 的 两 两 组 合 。 
center: 垂直 居中 ， 水 平 居中 





10.1.3 ”按钮 组 件 Button 


1. 创建 和 显示 Button 对 象 
Button 组 件 用 于 在 窗口 中 设置 和 显示 按钮 。 创 建 Button 对 象 的 基本 方法 如 下 : 


Button 对 象 = Button (tkinter Windows 窗口 对 象 ，text = Button 显示 名 称 ， 
command = 点 击 后 调用 ) 
Button 对 象 .pack () 


【 例 10-7】 创建 简单 的 按钮 : 


import tkinter 
from tkinter import messagebox 
def Submit () : 
messagebox .showinfo (title = "",message = "提交 ") 
win = tkinter.Tk() 间 创 建 窗口 对 象 
win.title ("使 用 button 组 件 的 简单 例子 ") # 设 置 窗口 标题 
b = tkinter.Button (win, text = "提交 ", command = Submit) # 创 建 Button 组 件 
b.pack() # 显 示 Button 组 件 
win.mainloop () 


运行 上 面 的 程序 ， 会 显示 如 图 10-7(a) 所 示 的 窗口 ， 在 窗口 中 单 击 “ 提 交 ” 按 钮 ， 就 会 
调用 Submit() 函 数 ， 弹 出 如 图 10-7(b) 所 示 的 提示 窗口 ， 单 击 “ 确 定 ” 按 钮 后 将 数据 提交 。 
7 || 


[i 提交 
4 使 有 utt，- 口 本 到 
提交 | mam 
(a) 带 有 一 个 Button 组 件 的 窗口 (b) 提交 确认 窗口 
图 10-7 一 个 Button 组 件 
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本 例 程序 用 到 了 消息 框 组 件 ，10.1.4 小 节 将 对 此 做 详细 的 介绍 。 

2.， Button 对 象 的 常用 属性 

按钮 上 既 可 以 显示 文本 ， 也 可 以 显示 用 户 自 定义 的 图 片 。 可 以 应 用 image 属性 和 bm 
属性 进行 设置 ， 其 方法 如 下 : 

bm = PhotoImage (file = 图 片 名 ) 


bt= Button (win，text = "图 片 "，image = bm，command = 点 击 后 调用 ) 
bt.bm = bm 


【 例 10-8】 创 建 图 片 格式 的 按钮 : 


import tkinter 
from tkinter import messagebox 





def Submit() : 
messagebox .showinfo (title = ""，message = "提交 ") 


win = tkinter.Tk() ## 创 建 窗口 对 象 

win.title(" 使 用 button 组 件 的 简单 例子 ") “ 间 设 置 窗口 标题 

bm = tkinter.PhotoImage (file = 
"D:\Anaconda3\Lib\idlelib\Icons\idle 48.png") 

bt= tkinter.Button (win，text = "图 片 "，image = bm, command = Submit) 
bt.bm = bm 

bt.pack() 

win.mainloop() 


运行 上 面 的 代码 后 ， 会 显示 如 图 10-8 所 示 的 窗口 。 

从 图 中 可 以 看 出 ， 因 为 未 设置 按钮 的 大 小 和 位 置 ， 所 以 按钮 显示 的 位 置 不 是 十 分 合 
我 们 可 以 通过 下 面 的 代码 对 其 进行 设置 。 

【 例 10-9】 设置 一 个 位 置 合理 的 按钮 : 


import tkinter 
from tkinter import messagebox 





交 





def Submit(): 
messagebox .showinfo (title = "",message = "提交 ") 


win = tkinter.Tk() # 创 建 窗 口 对 象 
win.title ("使 用 button 组 件 的 简单 例子 ") # 设 置 窗口 标题 


bm = tkinter.PhotoImage (file = 

"D:\Anaconda3\Lib\idlelib\Icons\idle 48.png") 

label = tkinter.Label (win, image = bm) 

label.bm = bm 

label .pack () 

b= tkinter.Button (win, text=" 确 认 ", command=Submit, width=10, height=1, 
compound="bottom") # 创 建 button 对 象 

b.pack() 

win.mainloop() 
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在 上 面 的 代码 中 ， 通 过 设置 Button 组 件 的 width 属性 和 height 属性 ， 改 变 了 Button 组 
件 的 大 小 ， 使 其 看 起 来 更 加 美观 。 同 时 ， 通 过 设置 compound 属性 ， 调 整 了 Button 组 件 的 
位 置 ， 效 果 如 图 10-9 所 示 。 


putt.，- 二 匡 到 
4 使 用 utt，- 口 区 到 VA 


Ew [ 
| 
10-8 图 片 格式 的 Button 图 10-9 位 置 合理 的 Button 


除了 上 述 属性 外 ，Button 组 件 还 有 一 些 其 他 的 常用 属性 ， 如 表 10-3 所 示 。 
表 10-3 Button 组 件 的 常用 属性 























属 性 说 明 
娩 设置 组 件 的 前 景色 
bg 设置 组 件 的 背景 色 


设置 文本 或 图 像 如 何在 按钮 上 显示 ， 默 认 值 为 None。 

当 指定 Image/bitmap 时 ， 本 文 (texb) 将 会 被 覆盖 ， 只 显示 图 像 。 可 用 值 如 下 。 
Left: 图 像 居 左 显示 。 

compound Right: 图 像 居 右 显 示 。 

Top: 图 像 居 上 显示 。 

Bottom: 图 像 居 下 显示 。 

Center: 图 像 居 中 显示 

wraplength 指定 单行 文本 的 长 度 ， 用 于 多 行文 本 显示 


bitmap 指定 按钮 显示 位 图 
state 设置 组 件 状态 
bd 设置 按钮 边框 大 小 ， 默 认 值 为 1 或 2 个 像素 





【 例 10-10】 设 置 一 个 有 边框 的 按钮 : 


import tkinter 
from tkinter import messagebox 


win = tkinter.Tk() # 创 建 窗口 对 象 
win.title ("使 用 button 组 件 的 简单 例子 ") ## 设 置 窗口 标题 
bl= tkinter.Button (win, text = "加 粗 按钮 ",bd = 10) # 创 建 Button 对 象 
b2= tkinter.Button (win, text = "被 禁用 的 按钮 ", state = "disabled") 
# 创 建 Button 对 象 


bl.pack() 
b2.pack() 
win.mainloop() 
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在 例 10-10 中 ， 我 们 设置 了 两 个 按钮 ， 其 中 一 个 设置 为 加 粗 的 边框 ， 另 一 个 设置 为 禁 
用 状态 ， 效 果 如 图 10-10 所 示 。 











图 10-10 有 边框 的 Button 
10.1.4 ”消息 框 组件 Messagebox 
弹出 消息 框 是 图 形 界面 的 一 个 基本 功能 ， 在 图 形 界面 的 应 用 中 也 是 最 广 的 。 在 tkinter 
可 以 使 用 tkinter.messagebox 模块 来 实现 此 功能 。 
1. 弹出 一 个 提示 消息 框 
使 用 showinfo0 函 数 可 以 弹出 提示 消息 框 ， 具 体格 式 如 下 : 
showinfo (title = 标题 ，message= 提示 内 容 ) 


【 例 10-11】 使 用 showinfo0) 弹 出 一 个 提示 消息 框 : 


from tkinter.messagebox import * 
showinfo (title=" 提 示 "，message=" 欢 迎 使 用 本 系统 ") 


运行 上 面 的 程序 ， 会 弹出 一 个 如 图 10-11 所 示 的 提示 消息 框 。 单 击 “ 确 定 ” 按 钮 或 者 
右上 角 的 “X ”按钮 可 关闭 该 提示 消息 框 。 


于 





图 10-11 提示 消息 框 


2. 弹出 警告 消息 框 
使 用 showwaming() 函 数 可 以 弹出 警告 消息 框 ， 方 法 如 下 : 
showwarning (title = 标题 ，message = 内 容 ) 


【 例 10-12】 使 用 showwarning0 函 数 弹 出 一 个 警告 消息 框 : 


from tkinter.messagebox import * 
showwarning (title=" 提 示 "，message=" 请 填写 验证 码 ") 
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运行 程序 ， 会 弹出 一 个 如 图 10-12 所 示 的 警告 消息 框 。 可 以 看 出 ， 和 警告 消息 框 左 侧 的 
警告 图 标 与 上 面 的 提示 消息 框图 标 不 同 。 
3. 弹出 错误 消息 框 
使 用 showerror0 函 数 可 以 弹出 错误 消息 框 ， 方 法 如 下 : 
showerror (title = 标题 ，message = 内 容 ) 


【 例 10-13】 使 用 showerror0 弹 出 一 个 错误 消息 框 : 


from tkinter.messagebox import * 
showerror (title=" 提 示 "，message=" 账 号 或 密码 错误 ") 


运行 上 面 的 代码 ， 会 弹出 一 个 如 图 10-13 所 示 的 错误 消息 框 ， 左 侧 显 示 为 错误 图 标 。 











10-12 ”警告 消息 框 10-13 ”错误 消息 框 


4. 弹出 疑问 消息 框 

使 用 askquestion(0) 函 数 可 以 弹出 一 个 包含 “是 (yes)” 和 “和 否 ao)” 按 钮 的 疑问 消息 框 ， 
方法 如 下 : 

askquestion (title = 标题 ，message = 内 容 ) 

如 果 用 户 单 击 “ 是 ”按钮 ， 则 askquestion0 函 数 返 回 字符 串 “YES”; 如 果 用 户 单 击 
“ 否 ” 按 钮 ， 则 askquestion() 函 数 会 返回 字符 串 “NO”。 

【 例 10-14】 使 用 askquestion0 函 数 弹出 一 个 疑问 消息 框 : 


from tkinter.messagebox import * 
ret = askquestion (title = "密码 修改 ", message = "是 否 确认 重 置 此 密码 ? ") 
if ret == YES: 
showinfo (title=" 提 示 "，message=" 密 码 已 重 置 ") 
运行 上 面 的 代码 ， 就 会 弹出 一 个 如 图 10-14 所 示 的 疑问 消息 框 。 
也 可 以 使 用 askyesnocancel0 实 现 上 面 的 功能 。 与 askquestion() 函 数 不 同 的 是 ， 用 户 单 
击 “ 是 ”或 “ 否 ” 时 ， 返 回 值 为 Trme 或 者 False。 


5. 其 他 格式 的 疑问 消息 框 


使 用 askokcancel0 函 数 ， 可 以 弹出 一 个 包含 “确定 ”和 “取消 ”的 疑问 消息 框 ， 方 法 
如 下 : 


askokcancel (title = 标题 ， message = 内 容 ) 
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用 户 单 击 “ 确 定 ” 或 “取消 ”按钮 时 ，askokcancel0 函 数 会 返回 True 或 者 False。 

【 例 10-15】 弹 出 一 个 带 “ 确 认 ” 和 “取消 ”按钮 的 疑问 消息 框 : 

from tkinter.messagebox import * 

ret = askokcancel (title = "密码 修改 "，message = "是 否 确认 重 置 此 密码 ? ") 

if ret == True: 

showinfo (title=" 提 示 "，message=" 密 码 已 重 置 ") 

运行 上 面 的 代码 ， 显 示 如 图 10-15 所 示 的 疑问 消息 框 ， 可 见 按钮 已 经 变 成 了 “确定 ” 

和 “取消 29 忆 


sn El 3s 改 区 
| 





[7 sswvuaauam， 


Cag am | | ED _= 





10-14 ” 带 “ 是 ”和 “和 否 ”的 疑问 消息 框 图 10-15 带 “ 确 定 ” 和 “取消 ”的 疑问 消息 框 

使 用 askretrycancel0 函 数 ， 可 以 弹出 一 个 包含 “ 重 试 ” 和 “取消 ”按钮 的 疑问 消息 
框 。 方 法 如 下 : 

askretrycancel (title = 标题 ，message = 内 容 ) 

【 例 10-16】 弹 出 一 个 带 “ 重 试 ” 和 “取消 ”按钮 的 警告 消息 框 : 


from tkinter.messagebox import * 
ret = askretrycancel (title = "密码 修改 "，message = "操作 超时 ") 


if ret == True: 
showinfo (title=" 提 示 "，message=" 数 据 重 置 ") 
运行 上 面 的 代码 ， 会 弹出 如 图 10-16 所 示 的 警告 消息 框 ， 单 击 “ 重 试 ”按钮 ， 会 弹出 
如 图 10-17 所 示 的 提示 消息 框 。 


密码 修改 | 





图 10-16 警告 消息 框 图 10-17 ”提示 消息 框 








10.1.5 “只 读 文本 框 Entry 
Entry 组 件 用 于 在 窗口 中 输入 单行 文本 。 
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1. 创建 和 显示 Entry 组 件 对 象 
创建 Entry 组 件 的 方法 如 下 : 
Entry 对 象 = Entry (tkinter Windows 窗口 对 象 ) 
Entry 对象.pack () 
【 例 10-17】 使 用 Entry 组 件 的 简单 例子 : 


import tkinter 

win = tkinter.Tk() ## 创 建 窗口 对 象 

win.title ("使 用 Entry 组 件 的 简单 例子 ") 埋设 置 窗口 标题 
entry = tkinter.Entry (win) 创建 Entry 组 件 
entry.pack() 

win.mainloop() 


运行 上 面 的 代码 ， 就 会 弹出 一 个 如 图 10-18 所 示 的 窗口 。 
久 。 使 用 Entry 组 件 的 简单 例子 “一 口 








10-18 一 个 Entry 组 件 


2. 获取 Entry 组 件 的 内 容 
为 了 获取 Entry 组 件 的 内 容 ， 需 要 使 用 textvariable 属性 为 Entry 组 件 指定 一 个 对 应 的 


变量 ， 例 如 : 


import tkinter 
win = tkinter.Tk() # 创 建 窗口 对 象 
win.title ("使 用 Entry 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 


e = tkinter.stringVar() 
tkinter.Entry (win, textvariable=e) .pack() 
win.mainloop() 


这 样 ， 在 后 面 的 步骤 中 就 可 以 使 用 e.get0 获 取 Entry 组 件 的 选中 内 容 了 ， 也 可 以 使 用 














e.set0 设 置 Entry 组 件 的 内 容 。 
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【 例 10-18】 使 用 一 个 Button 组 件 获 取 Entry 组 件 的 内 容 : 


import tkinter 
win = tkinter.Tk() 间 创 建 窗口 对 象 
win.title(" 使 用 Entry 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 


def Callbutton () : 
Print(e.get()) 


e = tkinter.StringVar() 
entry = tkinter.Entry (win, textvariable=e) .pack() 
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p= tkinter.Button (win，text=" 获 取 Entry 内 容 "，command=Callbutton, 
width=10，height=1) # 创 建 Button 对 象 

e.set ("Python") 

b.pack() 

win.mainloop() 


程序 定义 了 一 个 Button 组 件 和 一 个 Entry 组 件 ， 使 用 变量 e 绑 定 Entry 组 件 到 Button 
组 件 上 。 单 击 Button 组 件 会 调用 Callbutton()， 通 过 e.get0 函 数 打印 Entry 组 件 的 状态 ， 效 
果 如 图 10-19 所 示 。 








图 10-19 获取 Entry 的 内 容 
10.1.6 单 选 按钮 组 件 Radiobutton 


Radiobutton 组 件 用 于 在 窗口 中 显示 单 选 按钮 组 件 。 同 一 组 单 选 按钮 的 选项 中 只 可 以 有 
一 个 选项 被 选中 ， 也 就 是 说 ， 当 一 个 选项 被 选中 后 ， 其 他 的 选项 就 会 自动 被 取消 选中 。 

创建 Radiobutton 对 象 的 基本 方法 如 下 : 

Radiobutton 对 象 = Radiobutton (Tkinter Windows 窗口 对 象 ，text = Radiobutton 

组 件 显示 的 文本 内 容 ) 

Radiobutton 对 象 .pack() 

创建 完成 后 ， 每 个 选项 会 自动 成 为 一 个 分 组 。 还 需要 使 用 variable 属性 为 Radiobutton 
组 件 指定 一 个 变量 名 。 当 多 个 组 件 被 指定 同一 变量 名 时 ， 这 些 组 件 就 会 自动 地 被 划 归 到 一 
个 分 组 ， 分 组 后 需要 使 用 value 参数 设置 每 一 个 选项 的 值 ， 以 表示 该 值 是 否 被 选中 。 

【 例 10-19】 使 用 Radiobutton 组 件 的 简单 例子 : 


import tkinter 


win = tkinter.Tk() 间 创 建 窗口 对 象 

win.title(" 使 用 Radiobutton 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 

V = 七 kinter.IntVar() 

V.set(1) 

rl = tkinter.Radiobutton (win，text=" 男 "，variable=v，value=1) 
# 创 建 Radiobutton 组 件 


rl.pack() # 显 示 Radiobutton 组 件 
r2 = tkinter.Radiobutton (win, text=" 女 ", variable=v, value=0) 
# 创 建 Radiobutton 组 件 


r2.pack() # 显 示 Radiobutton 组 件 
win.mainloop() 


运行 上 面 的 代码 ， 就 会 弹出 一 个 如 图 10-20 所 示 的 窗口 。 当 选中 “ 男 ”选项 时 ， 
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“ 女 ” 选 项 被 自动 取消 选中 ， 再 次 选中 “ 女 ” 选 项 时 ，“ 男 ”选项 被 自动 取消 。 


和 使 用 Radi.. 一 口 
G 男 
C 女 











图 10-20 ”使 用 Radiobutton 组 件 
10.1.7 复 选 框 组 件 Checkbutton 


Checkbutton 组 件 用 于 在 窗口 中 显示 复 选 框 。 
创建 Checkbutton 的 方法 如 下 : 


Checkbutton 对 象 = Checkbutton (Tkinter Windows 窗口 对 象 ，text= 显 示 文 本 内 容 
command= 点 击 后 调用 的 函数 ) 


【 例 10-20】 使 用 Checkbutton 的 简单 例子 : 


import tkinter 
from tkinter import messagebox 


def Callcheckbutton(): 
messagebox.showinfo (title=""，message=" 提 交 ") 


win = tkinter.Tk() # 创 建 窗口 对 象 

win.title ("使 用 Checkbutton 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 
b = tkinter.Checkbutton (win, text="Python Tkinter", 
command=Callcheckbutton) # 创 建 Checkbutton 对 象 
b.pack() # 显 示 Checkbutton 对 象 

win.mainloop() 


运行 此 程序 ， 会 显示 如 图 10-21 所 示 的 窗口 ， 勾 选 复 选 框 后 ， 会 调用 Callcheckbutton() 


函数 ， 弹 出 一 个 如 图 10-22 所 示 的 提交 消息 框 。 
[4 EI 
= 


图 10-21 一 个 Checkbutton 组 件 图 10-22 提交 消息 框 








使 用 Chec... 一 口 
| 厂 python Tkinter 
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当然 ， 在 实际 应 用 中 ， 我 们 遇 到 的 更 多 情况 是 同时 勾 选 多 个 选项 ， 然 后 用 一 个 Button 
按钮 进行 提交 。 这 时 就 需要 判断 Checkbutton 组 件 的 选项 是 否 被 选中 。 

Checkbutton 组 件 有 ON 和 OFF 两 种 状态 值 ， 默 认 状 态 下 ON 值 为 1，OFF 值 为 0。 也 
可 以 使 用 内 置 属 性 onvalue 来 设置 Checkbutton 被 选中 时 的 值 ， 使 用 offvalue 设置 
Checkbutton 组 件 被 取消 选中 时 的 值 ， 设 置 方法 如 下 : 

Checkbutton (win，text=" 优 秀 "，onvalue="1"，offvalue="0"， 

command=Callcheckbutton) .Pack 

win.mainloop() 

为 了 获取 Checkbutton 组 件 的 状态 ， 需 要 使 用 variable 属性 为 Checkbutton 指定 一 个 变 
量 名 ， 例 如 : 

Checkbutton (root，text=" 优 秀 ",，variable=value, onvalue="1", offvalue="0", 

command=Callcheckbutton) 

这 样 就 可 以 在 Button 按钮 中 设置 被 单 击 后 调用 value.get() 函 数 来 获取 Checkbutton 组 件 
的 被 选取 状态 了 。 也 可 以 通过 使 用 value.set0 函 数 来 设置 Checkbutton 组 件 的 状态 。 

【 例 10-21】 简 单 的 复 选 框 例 子 : 


import tkinter 


win = tkinter.Tk() ## 创 建 窗 口 对 象 
win.title(" 使 用 Checkbutton 组 件 的 简单 例子 ") # 设 置 窗口 标题 
V = tkinter.IntVar() 


def Callcheckbutton () : 
Print(v.get()) 


cb = tkinter.Checkbutton (win, variable=v, text="Checkbutton", 

onvalue="]1", offvalue="0", command=Callcheckbutton) .pack() 

b = tkinter.Button (win，text=" 获 取 Checkbutton 状态 "， 

command=Callcheckbutton，width=20) .pack() # 创 建 Button 组 件 

v.set ("1") 

win.mainloop() 

上 面 的 代码 首先 定义 了 一 个 全 选 和 取消 全 选 的 复 选 框 。 通 过 单 击 调用 checkbutton_on() 
函数 或 者 checkbutton_off0) 函 数 设置 所 有 的 Checkbutton 组 件 的 状态 。 再 设置 一 个 Button 按 
钮 ， 使 用 Callcheckbutton0) 函 数 将 变量 value 绑 定 到 Button 组 件 上 。 单 击 Button 按钮 后 ， 
会 调用 Callcheckbutton0 函 数 ， 打 印 出 Checkbutton 组 件 的 状态 ， 效 果 如 图 10-23 所 示 。 


儿 使 用 Chec.… 一 口 


I Checkbutton 


获取 Checkbutton 状 态 


10-23 ”获取 复 选 框 的 内 容 
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10.1.8 文本 框 组 件 Text 


/20. 


Text 组 件 用 于 在 窗口 中 输入 多 行文 本 内 容 。 创 建 Text 对 象 的 具体 方法 如 下 : 


Text 对 象 = Text (Tkinter Windows 窗口 对 象 ) 
Text 对 象 .pack () 


【 例 10-22】 简 单 的 Text 组 件 的 例子 : 


import tkinter 





win = tkinter.Tk() ## 创 建 窗口 对 象 

win.title(" 使 用 Text 组 件 的 简单 例子 ") ## 设 置 窗口 标题 
t = tkinter.Text (win) # 创 建 Text 组 件 

七 .pack () 

win.mainloop () 


运行 上 面 的 程序 ， 就 会 弹出 一 个 如 图 10-24 所 示 的 窗口 。 
9 使 用 Text 组 件 的 简单 例子 - 口 攻 本 











10-24 一 个 Text 组 件 
也 可 以 通过 Text.insert() 方 法 向 文本 框 内 添加 内 容 。insert0 方 法 的 语法 如 下 : 
Text 组 件 .insert (插入 位 置 ， 插 入 的 文本 ) 


其 中 ， 插 入 位 置 格式 为 “ 行 数 . 列 数 ”。 
【 例 10-23】 使 用 TextinsertO 函 数 向 Text 组 件 内 添加 文本 内 容 : 


import tkinter 


win = tkinter.Tk() # 创 建 窗口 对 象 

win.title ("使 用 Text 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 
七 = tkinter.Text (win) # 创 建 Text 组件 

t.insert (1.1, "2017-01-17:12138") 

t.insert (1.5, "insterted") 

t.pack() 

win.mainloop() 
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上 面 的 例子 向 Text 组 件 的 第 1 行 第 1 列 插入 数据 “2017-01-17:12138”， 并 在 第 1 行 
第 5 列 插入 字符 “inserted”， 运 行 结果 如 图 10-25 所 示 。 


9 使 用 Text 组 件 的 简单 例子 - 口 


2017-insterted01-17: 12138 


























10-25 ”向 Text 添加 内 容 


10.1.9 列表 框 组 件 Listbox 


Listbox 组 件 是 一 个 列表 框 组 件 ， 用 于 在 窗口 中 显示 多 个 文本 项 。 
1. 创建 和 显示 Listbox 对 象 

创建 Listbox 对 象 的 基本 方法 如 下 : 

Listbox 对 象 = Listbox (tkinter Windows 窗口 对 象 ) 


Listbox 对 象 .pack () 
可 以 使 用 insert() 方 法 向 列表 框 中 添加 文本 项 ， 方 法 如 下 : 


Listbox 对 象 .insert (index, item) 


参数 说 明 如 下 。 

index: 插入 文本 项 的 位 置 ， 如 果 是 在 尾部 插入 文本 项 ， 则 可 以 使 用 end 参数 ， 如 果 在 
当前 选中 处 插入 文本 项 ， 可 以 选用 active 选项 。 

item: 插入 的 文本 项 。 

【 例 10-24】 使 用 Listbox 的 简单 例子 : 


import tkinter 


win = tkinter.Tk() # 创 建 窗口 对 象 
win.title ("使 用 Listbox 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 
Lb = tkinter.Listbox (win) 
for item in [" 北 京 ", "上 海 ", "天津 "] : 
Lb.insert ("end", item) 
Lb.pack() 
win-mainloop () 


运行 上 面 的 程序 ， 会 弹出 一 个 如 图 10-26 所 示 的 窗口 。 
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2. 设置 多 选 的 列表 框 


将 selectmode 属性 设置 为 multiple， 可 以 设置 多 选 的 列表 框 。 
【 例 10-2S】 设 置 多 选 的 列表 框 : 


import tkinter 


win = tkinter.Tk() # 创 建 窗口 对 象 
win.title ("使 用 Listbox 组 件 的 简单 例子 ") # 设 置 窗口 标题 
Lb = tkinter.Listbox (win,selectmode = "multiple") 
For TEem dn fm 北京 ">" 上 上 海 m "天 津 "1: 

Lb.insert ("end", item) 
Lb.pack() 
win.mainloop() 


运行 效果 如 图 10-27 所 示 。 


外 使 用 Text.， 一 吕 > 


| Hl 康 
| 上海 
示 沼 


4 使 用 Text.， 一 口 匡 到 
































图 10-26 一 个 Listbox 组 件 10-27 设置 多 选 的 列表 框 


3. 获取 Listbox 组 件 的 内 容 
为 了 获取 Listbox 组 件 的 内 容 ， 需 要 使 用 listvariable 属性 为 Listbox 组 件 指 定 一 个 对 应 


的 变量 ， 例 如 : 


.( 294\. 


L = tkinter.StringVar() 

tkinter.Listbox (win, listvariable=L) .pack() 

win.mainloop() 

这 样 一 来 ， 在 后 面 的 代码 中 我 们 就 可 以 用 L.get 方 法 获取 Listbox 组 件 的 内 容 了。 
【 例 10-26】 使 用 一 个 Button 按钮 组 件 获取 Listbox 组 件 的 内 容 : 


import tkinter 
win = tkinter.Tk() # 创 建 窗口 对 象 


win.title ("使 用 Listbox 组 件 的 简单 例子 ") 
L = tkinter.StringVar() 


坦 设置 窗口 标题 


Gef Calllistbox() : 
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print (L.get ()) 


Lb = tkinter.Listbox(win,1istvariable = LI) # 创 建 Listbox 组 件 
for item in [" 北 京 "," 上 海 "," 天 津 "]: 
Lb.insert ("end", item) 

Lb.pack() 间 显 示 Iistbox 对象 

b = tkinter.Button (win，text=" 获 取 Listbox 内 容 "， command=Cal11istbox， 

width=20) # 创 建 Button 组 件 

b.pack() 寺 显 示 Button 对 象 

win-mainloop () 

程序 定义 了 一 个 Button 组 件 和 一 个 Listbox 组 件 ， 并 使 用 变量 工 将 Listbox 组 件 绑 定 
到 Button 按钮 上 。 单 击 Button 按钮 ， 就 会 调用 Calllistbox0 函 数 ， 并 通过 L.get0 函 数 打 印 
出 组 件 Listbox 的 内 容 。 


10.1.10 ”菜单 组 件 Menu 


Menu 组 件 是 一 个 菜单 组 件 ， 用 于 在 窗口 中 显示 菜单 条 和 下 拉 菜 单 。 
1. 创建 和 显示 Menu 对 象 
创建 Menu 对 象 的 方法 如 下 : 


Menu 对 象 = Menu (Tkinter Windows 窗口 对 象 ) 
Tkinter Windows 窗口 对 象 ["menu"] = menubar 
Tkinter Windows 窗口 对 象 .mainloop () 


可 以 使 用 add_command() 方 法 向 Menu 组 件 中 插入 菜单 项 ， 方 法 如 下 : 
Menu 对 象 .add_command (label = 菜单 文本 ，command = 菜单 命令 函数 ) 
【 例 10-27】 使 用 Menu 组 件 的 简单 例子 : 


import tkinter 


win = tkinter.Tk() # 创 建 窗口 对 象 
win.title ("使 用 Menu 组 件 的 简单 例子 ") ”# 设 置 窗口 标题 


def Hello(): 


print ("这 是 一 个 菜单 组 件 ") 


m = tkinter.Menu (win) 
for item in [" 文 件 ", "编辑 ", "帮助 "] : 
m.add command(label = item,command = Hello) 
win["menu"] = m 
win.mainloop() 


运行 上 面 的 程序 ， 会 弹出 一 个 如 图 10-28 所 示 的 窗口 。 
2. 添加 下 拉 菜 单 
面 介 绍 的 Menu 组 件 只 是 创建 了 一 行 主 菜单 ， 默 认 情况 下 并 不 包含 下 拉 菜单 。 我 们 
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可 以 通过 将 一 个 Menu 组 件 作 为 另 一 个 Menu 下 拉 菜 单 的 方法 实现 下 拉 菜 单 的 添加 。 具 体 
方法 如 下 : 
Menu 对 象 1.adqd command (label = 文本 菜单 ，menu = Menu 对 象 2) 
上 面 的 语句 将 Menu 对 象 2 设置 为 Menu 对 象 1 的 下 拉 菜 单 。 注 意 ， 在 创建 Menu 对 
象 2 的 时 候 ， 也 要 指定 它 是 Menu 对 象 1 的 子 菜单 ， 方 法 如 下 : 
Menu 对 象 2 = menu (Menu 对 象 1) 
【 例 10-28】 创 建 带 下 拉 菜 单 的 Menu 组 件 : 


import tkinter 











win = tkinter.Tk() ## 创 建 窗口 对 象 
win.title ("使 用 Menu 组 件 的 简单 例子 ") “# 设 置 窗口 标题 


def Hello(): 
print ("这 是 一 个 菜单 组 件 ") 


m = tkinter.Menu (win) 
filemenu = tkinter.Menu (m) 
for item in [" 打 开 ", "关闭 ", "退出 "] : 


filemenu.add command(label = item,command = Hello) 


"文件 ", menu= filemenu) 
"编辑 ") 
"帮助 ") 


m.add cascade (label 
m.add cascade (label 
m.add cascade (label 
win["menu"] = m 
win.mainloop() 


运行 结果 如 图 10-29 所 示 。 


外 使 用 Men... 一 口 和 使 用 Men...， 一口 
文件 编 名 帮助 | 文件 | 编辑 帮助 
































图 10-28 一 个 Menu 组 件 10-29 ” 带 下 拉 菜单 的 Menu 组 件 
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10.1.11 ”滑动 条 组 件 Scale 


Scale 组 件 用 于 在 窗口 中 以 滑 块 的 形式 显示 一 个 范围 内 的 数字 。 可 以 设置 选择 数字 的 最 
小 值 、 最 大 值 和 步 长 值 。 


1. 创建 和 显示 Scale 对 象 
创建 Scale 对 象 的 基本 方法 如 下 : 


Scale 对 象 = Scale (Tkinter Windows 窗口 对 象 ，from = 最 小 值 ，to = 最 大 值 ， 
resolution = 步 长 值 ，orient = 显示 方向 ) 
Scale.pack() 


锐 注意 : from 是 Python 的 关键 字 ， 这 里 添加 下 划 线 是 为 了 与 关键 字 from 区 分 开 ， 又 
不 失 其 基本 含义 。 


【 例 10-29】 使 用 Scale 组 件 的 简单 例子 : 


import tkinter 


win = tkinter.TK() # 创 建 窗口 对 象 
win.title ("使 用 Scale 组 件 的 简单 例子 ")  # 设 置 窗口 标题 
s = tkinter.Scale (win, 
from = 0， 间 设 置 最 小 值 
to = 100， 间 设 置 最 大 值 
resolution = 1， # 设 置 步 长 
orient = "horizontal" 设置 水 平方 向 
) .pack () 
win.mainloop() 


运行 上 面 的 程序 ， 会 显示 如 图 10-30 所 示 的 窗口 。 
2. 获取 Scale 组 件 的 值 
需要 使 用 variable 属性 为 Scale 组 件 指定 一 个 变量 名 ， 例 如 : 


Scale 对 象 = scale (win, 
from = 最 小 值 ， 

to = 最 大 值 ， 
resolution = 步 长 值 ， 
orient = 显示 方向 ， 
variable = v) ,pack() 
win.mainloop () 


在 后 面 的 代码 中 ， 我 们 就 可 以 使 用 v.get0 函 数 来 获取 Scale 组 件 的 状态 了 。 也 可 以 使 
用 vsetO 属 性 来 设置 Scale 的 值 。 例 如 使 用 下 面 的 语句 ， 可 以 将 上 面 定 义 的 Scale 组 件 的 值 
设置 为 50: 

Vv.set (50) 


【 例 10-30】 使 用 一 个 Button 按钮 获取 Scale 组 件 的 值 : 
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import tkinter 


win = tkinter.Tk() 创建 窗口 对 象 
win.title ("使 用 Scale 组 件 的 简单 例子 ") # 设 置 窗口 标题 


V = tkinter.IntVar() 


def Callscale() : 
Print(v.get()) 


s = tkinter.Scale (win, 
from = 0， # 设 置 最 小 值 
to = 100， 井 设置 最 大 值 
resolution = 1， # 设 置 步 长 
orient = "horizontal"， # 设 置 水 平方 向 
variable = Vv 
) .pack() 
b = tkinter.Button (win，text=" 获 取 Scale 状态 "，command=Callscale, 
width=20) .pack() # 创 建 Button 组 件 
V.set(50) 
win.mainloop () 


程序 中 定义 了 一 个 Button 组 件 和 一 个 Scale 组 件 ， 使 用 变量 v 将 Scale 组 件 绑 定 到 























Button 按钮 上 。 单 击 Button 按钮 后 会 调用 Callscale0 函 数 ， 并 通过 v.getO 函 数 打印 出 Scale 
组 件 的 值 ， 效 果 如 图 10-31 所 示 。 
及 使 用 scale.. 四 | 口 
4 使 用 Scale.. 一 口 50 
5 | [als) 
画面 | 获取 Scale 状态 
10-30 一 个 Scale 组 件 10-31 获取 Scale 的 值 


10.2 ”网 格 布局 管理 器 


上 节 介 绍 了 大 量 的 Tkinter 组 件 ， 但 在 实际 应 用 中 会 发 现 ， 各 个 组 件 在 窗口 内 的 位 置 


并 不 是 很 整齐 。 


有 鉴于 此 ， 本 节 引 入 了 网 格 布局 管理 器 ， 用 于 将 组 件 放置 到 窗 体 的 指定 位 置 。 在 





Tkinter 模块 中 有 三 种 布局 管理 器 一 一 grid、pack 和 place。 由 于 grid 布局 管理 器 应 用 更 加 广 
泛 ， 上 手 更 加 容易 ， 所 以 本 节 主 要 介绍 grid 布局 管理 器 。pack 布局 管理 器 相对 grid 管理 器 
灵活 度 差 一 些 。 而 place 布局 管理 器 虽 能 精确 控制 组 件 位 置 ， 但 编程 也 相对 复杂 。 针 对 
Python 快速 编程 、 快 速 验 证 的 特点 ， 更 多 的 人 会 选用 grid 布局 管理 器 。 
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10.2.1 网 格 


网 格 是 一 个 假想 的 矩阵 ， 包 含水 平 线 和 垂直 线 ， 将 矩阵 分 隔 成 小 单元 格 (cel)。 第 1 行 
单元 格 的 行 号 为 0， 第 2 行 单元 格 的 行 号 为 1， 以 此 类 推 。 同 理 ， 第 1 列 单元 格 的 列 号 为 
0， 第 2 列 单元 格 的 列 号 为 1， 以 此 类 推 。 每 一 个 单元 格 由 行 号 和 列 号 标识 。 图 10-32 展示 
了 一 个 3x4 的 网 格 和 每 个 单元 格 的 编号 。 


row 0，column 0 |， row 0，column 1 | row 0，column 2 row0, column 3 
row1, column0 | row 1，column 1 | row1, column2 row1, column3 


row2, column0 ‘row2, column1 | row2, column2 row2, column 3 
10-32 ”网 格 与 单元 格 编号 的 对 应 关系 


图 10-32 中 显示 了 一 个 水 平和 垂直 方向 均匀 分 隔 的 空间 ， 但 这 并 不 是 常用 的 GUI 编程 
布局 ， 图 10-33 显示 了 一 些 常 用 的 布局 格式 。 

















10-33 ”常用 的 布局 格式 


组 件 放置 到 grid 中 可 以 创建 GUI 界面。 组 件 可 以 放置 在 一 个 单元 格 中 ， 也 可 以 放置 在 
多 个 连续 的 行列 中 ， 每 个 行列 会 自动 扩展 以 适应 最 大 组 件 。 参 数 padx 和 pady 用 于 具体 指 
定 放置 到 单元 格 中 组 件 周围 空白 区 域 的 大 小 。 

默认 地 ， 组 件 会 居中 显示 在 单元 格 中 ， 其 属性 sticky 可 用 于 改变 组 件 在 单元 格 中 的 放 
置 方式 ， 也 能 控制 放大 组 件 使 其 满足 单元 格 的 大 小 。 

图 10-34 显示 的 是 本 章 一 开始 所 列 代码 的 可 视 化 界面 。 网 格 为 5 行 2 列 ( 行 号 0 到 4， 
列 号 0 到 1)。 每 一 个 标签 控件 和 输入 控件 都 放 到 一 个 单元 格 内 。 

按钮 放置 在 第 3 行 第 0 列 位 置 ， 占 连续 两 列 单元 格 。 窗 体 中 的 其 他 两 个 组 件 的 声明 和 
布局 代码 如 下 : 参数 padx = 5， 在 组 件 左右 两 边 分 别 设 定 5 个 像素 的 空白 边界 ; 参数 pady 
= 5， 在 组 件 上 下 两 边 分 别 设 定 5 个 像素 的 空白 边界 ;参数 sticky = W， 移 动 输入 框 组 件 到 
单元 格 左边 ， 参 数 columnspan = 2， 设 定 组 件 占 两 个 合并 单元 格 。 

【 例 10-31】 房 屋 贷款 计算 器 程序 的 grid 布局 代码 : 


from tkinter import * 


win = Tk() 创建 窗口 对 象 
win.title ("房屋 贷款 计算 器 ") 间 设 置 窗口 标题 
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lab entNumber = Label (win, text = "贷款 金额 :") # 创 建 Label 标签 
lab entNumber.grid(row=0, column=0, padx=5, pady=5, sticky="e") 
坦 使 用 grid 进行 布局 


entNumber = Entry(win,width = 15) 捍 创 建 Entry 对 象 


entNumber.grid(row=0, column=1, padx=5, pady=5, sticky="w") 
# 使 用 grid 进行 布局 


lab rate = Label (win, text = "贷款 年 利率 (百分数 ) :") # 创 建 Label 标签 


lab rate.grid(row=1, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 


rate = Entry(win,width = 15) 间 创 建 Entry 对 象 


rate.grid(row = 1,column = 1,padx = 5,pady = 5,sticky = "w") 


# 使 用 grid 进行 布局 
lab years = Label (win, text = "还 款 年 数 :") # 创 建 Label 标签 


lab years.grid(row = 2,column = 0,padx = 5,pady = 5,sticky = "e") 


# 使 用 grid 进行 布局 
years = Entry (win,width = 15) # 创 建 Entry 对 象 


years.grid(row = 2,column = 1,padx = 5,pady = 5,sticky = "w") 


# 使 用 grid 进行 布局 


bt Calculate = Button (win, text = "计算 每 月 应 还 款 金额 :") 
# 创 建 button 对 象 ， 用 于 提交 数据 


bt Calculate.grid(row = 3,column = 0,columnspan = 2,pady = 5) 


# 使 用 grid 进行 布局 ， 横 跨 两 列 
lab payment = Label (win,text = "每 月 应 还 款 金额 :")  # 创 建 Label 标签 


lab payment .grid(row = 4,column = 0,padx = 5,pady = 5,sticky = "e") 
# 使 用 gria 进行 布局 


payment = Entry(win,width = 15,state = "readonly") # 创 建 Entry 对 象 


payment .grid(row = 4,column = 1,padx = 5,pady = 5,sticky = "w") 
# 使 用 grid 进行 布局 


win.mainloop() 


运行 效果 如 图 10-34 所 示 。 
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7 。 房屋 从 款 计算 器 ”- 口 攻 到 
贷款 会话 : 








贷款 年 利率 ( 百分数 ) : 
还 款 年 数 : 


计算 每 月 应 还 款 人 金额 : 


每 月 应 还 款 全 额 : 








10-34 ”房屋 贷款 计算 器 的 布局 


一 般 地 ， 用 widgetName.grid(row = m, column = n) 语 句 放置 组 件 到 第 m 行 第 n 列 的 单 
元 格 中 。grid 方法 还 包括 一 些 附 加 属性 ， 如 padx、pady、sticky 等 。 

使 用 widgetName.grid(row=m，colum=n，columnspan=c) 语 句 将 组 件 放 在 以 第 m 行 第 n 
列 为 起 始 位 置 ， 连 续 跨越 c 列 的 单元 格 中 。 如 果 将 columspan=c 换 成 rowspan=c， 将 连续 
跨越 c 行 。 

表 10-4 中 的 参数 用 来 设 定 组 件 空白 边界 的 布局 方法 。 

表 10-4 设 定 组 件 空白 边界 





参 数 效 果 
padx =r 在 组 件 左右 两 边 分 别 加 入 工 个 空白 像素 
pady =r 在 组 件 上 下 两 边 分 别 加 入 r 个 空白 像素 
padx = (1,s) 在 组 件 左 边 加 入 r 个 空白 像素 ， 在 组 件 右边 加 入 s 个 空白 像素 
pady = (1,s) 在 组 件 上 边 加 入 r 个 空白 像素 ， 在 组 件 下 边 加 入 s 个 空白 像素 


和 注意 :，grid 布局 管理 器 的 行 和 列 的 值 并 不 需要 特意 指定 。grid 布局 管理 器 将 自动 根据 
放 入 grid 中 的 组 件 位 置 决定 其 行列 。 此 外 ，grid 布局 管理 器 每 列 的 宽度 和 每 
行 的 高 度 都 会 自动 进行 调整 ， 以 适应 其 所 包含 的 所 有 组 件 的 宽度 、 高 度 和 空 


白 边界 。 
10.2.2 sticky 属性 
设置 sticky 属性 的 方法 如 下 : 


widgetName .grid(row = m, column = n, sticky = letter) 


这 里 letter 为 N、S、E 和 W 四 个 字母 之 一 ， 它 会 使 空间 边缘 靠近 单元 格 的 顶部 、 底 
部 、 右 侧 、 左 侧 排列 。 
【 例 10-32】 不 同 sticky 属性 的 显示 效果 : 


years = Entry (win，width=2) 井 创 建 Entry 对 象 
years.grid(row=0，column=1，sticky="e") 间 使 用 grid 进行 布局 


其 中 years = Entry(win，width=2) 语 句 声明 输入 框 组 件 为 years ，years.grid(row=0， 


:(301\. 


Mn mm Python 程序 设计 实用 教程 








column 一 1，sticky“e”) 语 句 则 将 输入 框 组 件 放 置 到 了 grid 布局 管理 器 中 。 图 10-35(a) 显 示 了 
放置 在 单元 格 中 间 的 效果 ， 其 余 几 个 子 图 显示 了 其 他 几 个 属性 的 布局 效果 。 


7_PEANHSS - "EE 1 pesmntas - °C 














计算 每 月 应 还 了 人 本 | 计算 与 有 应 于 人数 | 
(a) 未 设置 sticky (b) sticky=0 
7 RENN - EN 7 AINHiSS - 9 1 Fens -EE 
计划 每 月 应 还 软 人 数 | 计生 每 月 应 还 款 全 全 | 计算 每 月 应 还 坎 公关 | | 
(©) sticky=s (d) sticky=w (e) sticky=e 


10-35 不 同 的 sticky 属性 


sticky 属性 的 值 还 可 以 是 N、S、E 和 W 四 个 字母 的 两 两 组 合 ， 或 者 由 四 个 字母 组 合 
在 一 起 。 参 数 sticky = NS 使 得 组 件 的 上 下 边 相 连 ， 组 件 被 沿 垂直 方向 拉 伸 ， 同 理 ， 参 数 
sticky = EW 使 得 组 件 沿 水 平方 向 被 拉 伸 ; 参数 NSEW 使 得 组 件 沿 水 平和 垂直 两 个 方向 被 
拉 伸 ， 以 填充 整个 单元 格 。 上 述 组合 的 显示 效果 如 图 10-36 所 示 。 


9_ 户 呈 贷款 计算 器 “一 口 医 双 1 pest - 口 本 王 1 seat -区 
还 束 年 数 : 年数 : 还 蒜 年 数 ; 








计算 月 应 六 全 类 | 计算 每 月 应 于 次 全 上 | 计算 和 月 应 还 交会 烙 | | 








(a) sticky=NS (b) sticky=EW (C) sticky=NSEW 
10-36 不 同 的 sticky 属性 


10.2.3 ”向 列表 框 添加 垂直 滚动 条 


向 列表 框 添加 垂直 滚动 条 ， 可 以 通过 Tkinter 的 IstNE 组 件 和 yscroll 组 件 来 实现 。 具 
体 代 码 如 下 。 
【 例 10-33】 创 建 滚动 条 : 


from tkinter import * 


win = Tk() # 创 建 窗口 对 象 
win.title (" 创 建 滚动 条 的 简单 例子 ") ”# 设 置 窗口 标题 


yscroll = Scrollbar (win,orient = VERTICAL) 
yscroll.grid(row = 0, column = 2, rowspan = 4, padx = (0,100), pady = 5, 
sticky = "ns") 


statesList = [* 北 京 "," 上 海 ", "天 津 ",* 广 州 *",“ 深 圳 ", "重庆 ", "杭州 "] 

COonOF1stNE = StringVar() 

IStNE = Listbox(win, width = 14, height = 4, listvariable = conOF]1stNE, 
yscrollcommand = yscroll.set) 
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IstNE.grid(row = 0, column = 1, rowspan = 4, padx = (100,0), pady = 5， 
sticky = "e") 


ConOF1stNE.set (tuple (statesList)) 
yscroll["command"] = IstNE.yview() 
win.mainloop() 


站 注意 : 
@ ”滚动 条 组 件 的 声明 必须 在 列表 框 控件 之 前 。 
@ ”参数 yscrollcommand = yscroll.set 必须 在 列表 框 组 件 对 象 创 建 的 时 候 添加 到 其 构造 
器 中 。 
@ 代码 中 必须 包括 参数 yscroll[“command”] = IstNE.yview()。 
@ ”倒数 第 二 句 代码 的 作用 是 将 滚动 条 添加 到 列表 框 中 。 


界面 的 效果 如 图 10-37 所 示 ， 列 表 框 和 滚动 条 组 件 被 放置 到 相 邻 的 单元 格 中 ， 用 户 可 
以 通过 单 击 滚动 条 上 下 箭头 或 者 拖 电 滚 动 条 组 件 上 的 矩形 框 来 选择 列表 框 中 的 选项 。 此 
外 ，sticky 参数 保证 了 两 个 组 件 紧 密 相 连 ， 滚 动 条 垂直 填充 。 参 数 padx = (0.100) 和 padx = 
(100,0) 用 于 在 列表 框 左 侧 和 滚动 条 右 侧 保留 一 些 边界 。 
7 x 的 入 SH。 一口 本 到 
Ht 京 之 
号 了 
广州 -| 
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10.2.4 设计 窗 体 布局 


在 GUI 程序 开发 中 ， 窗 体 布 局 一 般 遵 循 如 下 准则 。 

(1) 用 户 通过 使 用 输入 框 组 件 键入 信息 ， 或 者 单 击 列表 框 中 的 列表 项 选择 信息 。 标 签 
组 件 通常 放置 在 输入 框 左 侧 ， 用 于 提示 输入 框 组 件 应 该 输入 什么 样 的 信息 ;标签 组 件 通常 
放 在 列表 框 上 方 ， 用 于 描述 列表 框 中 的 内 容 。 

(2) 程序 的 输出 信息 通常 用 只 读 输入 组 件 或 者 列表 框 。 如 果 列 表 框 中 显示 的 内 容 较 
多 ， 可 以 在 列表 框 组 件 旁 边 添加 垂直 滚动 条 来 帮助 显示 列表 框 内 容 。 

(3) 一 般 来 讲 ， 按 钮 模 跨 多 于 一 列 。 

(4) 列表 框 默认 包含 10 个 列表 项 。 

(5) 在 开始 界面 编程 时 ， 建 议 先 在 纸 上 做 一 个 草图 设计 ， 观 察 组 件 布局 ， 使 之 更 加 美 
观 ， 对 于 不 合理 的 布局 组 件 ， 可 以 适当 调整 。 

(6) 程序 第 一 次 运行 后 ， 程 序 员 通过 增加 空白 和 使 用 组 件 中 的 网 格 方法 的 sticky 参数 
加 以 调整 ， 优 化 设计 。 这 个 过 程 往往 要 反复 多 次 才能 完成 。 


.(303 \. 


mm Python 程序 设计 实用 教程 


10.3” GUI 编程 


GUI 编程 通常 采用 面向 对 象 的 编程 方式 。 然 而 为 了 尽 可 能 地 简化 代码 的 复杂 性 ， 我 们 


采用 一 种 直接 的 编程 方式 。 在 10.3.2 节 将 介绍 如 何 用 面向 对 象 方式 编写 GUI 程序 。 
10.3.1 将 TUI 程序 转换 成 GUI 程序 


一 般 来 说 ， 程 序 包含 三 个 部 分 一 一 输入 、 加 工 和 输出 。 


在 TUI 程序 中 ， 输 入 通常 用 input 语句 从 键盘 读 入 数据 ， 或 者 用 read 等 方法 从 文件 读 
入 数据 ;输出 则 通常 用 print 语句 把 数据 显示 到 屏幕 上 ， 或 者 用 write 等 方法 将 数据 写 入 到 
文件 中 。 当 将 TUI 程序 转换 成 GUI 程序 时 ， 我 们 通常 会 用 Label/Entry 组 件 来 代替 input 和 
print 语句 ， 而 数据 处 理 部 分 和 文件 读 写 与 GUI 程序 相同 ， 主 要 的 区 别 在 于 GUI 程序 的 处 











理 过 程 需要 由 一 个 事件 触发 。 


下 面 的 例子 将 本 章 开始 时 图 10-1(a) 所 示 的 TUI 程序 转化 成 GUI 程序 ， 网 格 由 5 行 2 


列 组 成 。 
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【 例 10-34】 使 用 GUI 界面 的 房贷 计算 器 : 


from tkinter import * 
from tkinter import messagebox 


win = Tk() 创建 窗口 对 象 
win.title ("使 用 GUI 界面 的 简单 房贷 计算 器 ") ”# 设 置 窗口 标题 


def Calculation(): 
对 
Principal float (number of ent.get()) 
year rate float (number of rate.get()) 
month rate = year rate / 12 # 转 换 成 月 利率 
years = float (number of years.get ()) 
months = years * 12 间 转 换 成 月 数 
sum = (Principal * (month rate/100) * pow((1 + month rate/100), 
months))\ 


/(pow((1 + month rate/100)，months)-1) # 月 还 款 计 算 公 式 
number of repay.set (round(sum，2) ) # 保 留 两 位 小 数 并 输出 
except: 
messagebox.showerror (title=" 提 示 "，message=" 输 入 错误 ， 请 重新 输入 ") 


lab entNumber = Label (win，text=" 贷 款 金 额 :") # 创 建 Label 标签 
lab entNumber.grid(row=0, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 


number of ent = IntVvar() 
entNumber = Entry(win, width=15, textvariable=number of ent) 
# 创 建 Entry 对 象 
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entNumber -grid (row=0， column=1, padx=5, pady=5, sticky="w") 
井 使 用 grid 进行 布局 


lab rate = Label (win，text=" 贷 款 年 利率 (百分数 ) :") # 创 建 Label 标签 
lab rate.grid(row=1, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 
number of rate = DoubleVar() 
rate = Entry(win, width=15, textvariable=number of rate) # 创 建 Entry 对 象 
rate.grid(row=1，column=1，padx=5，pady=5，sticky="w") 间 使 用 grid 进行 布局 


lab years = Label (win，text=" 还 款 年 数 :")  ## 创 建 Label 标签 
lab years.grid(row=2, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 


number of years = IntVvar() 
years = Entry(win, width=15, textvariable=number of years) 
# 创 建 Entry 对 象 
years.grid(row=2，column=1，padx=5，pady=5，sticky="w") 间 使 用 grid 进行 布局 


bt Calculate = Button (win，text=" 计 算 每 月 应 还 款 金额 "， command=Calculation) 
# 创 建 button 对 象 ， 用 于 提交 数据 
bt Calculate.grid(row=3, column=0, columnspan=2, pady=5) 


# 使 用 grid 进行 布局 ， 横 跨 两 列 


lab payment = Label (win，text=" 每 月 应 还 款 金额 :")  # 创 建 Label 标签 
lab payment .grid(row=4, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 
number of repay = DoubleVar() 
payment = Entry(win, width=15, 
state="readonly", textvariable=number of repay) # 创 建 Entry 对 象 
payment .grid (row=4, column=1, padx=5, pady=5, sticky="w") 
# 使 用 gria 进行 布局 
win.mainloop () 
运行 后 的 界面 如 图 10-1(b) 所 示 。 通 过 比较 图 10-1(a) 与 图 10-1(b)， 读 者 不 难 想象 ， 无 
论 是 从 视觉 效果 来 看 ， 还 是 从 用 户 操作 的 方便 性 来 看 ， 图 形 用 户 界 面 远 优 于 文本 界面 ， 这 
也 是 GUI 非常 流行 的 根本 原因 。 


10.3.2 面向 对 象 编程 


关于 面向 对 象 的 方法 ， 第 6 章 已 做 详细 介绍 ， 本 章 不 复 赣 述 。 下 面 的 例子 就 是 使 用 
向 对 象 方法 编写 的 GUI 房贷 计算 器 。 
【 例 10-35】 使 用 面向 对 象 方式 编写 的 GUI 房贷 计算 器 : 


from tkinter import * 
from tkinter import messagebox 






































class MortgageCalculator: 


def nit (selfjs 
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win = TKk() 间 创 建 窗口 对 象 
win.title ("使 用 GUI 界面 的 简单 房贷 计算 器 ") # 设 置 窗口 标题 


lab entNumber = Label (win，text=" 贷 款 金额 :") # 创 建 Label 标签 
lab entNumber.grid(row=0, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 


self.number of ent = IntVar() 


entNumber = Entry (win, width=15, textvariable=self.number of ent) 


# 创 建 Entry 对 象 
entNumber.grid(row=0, column=1, padx=5, pady=5, sticky="w") 
# 使 用 grid 进行 布局 


lab rate = Label (win，text=" 贷 款 年 利率 (百分数 ) :") # 创 建 Label 标签 
lab rate.grid(row=1, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 
self.number of rate = DoubleVar() 
rate = Entry(win, width=15, textvariable=self.number of rate) 
# 创 建 Entry 对 象 
rate.grid(row=1, column=1, padx=5, pady=5, sticky="w") 
埋 使 用 grid 进行 布局 


lab years = Label (win，text=" 还 款 年 数 :")  ## 创 建 abel 标签 
lab years.grid(row=2, column=0, padx=5, pady=5, sticky="e") 
# 使 用 grid 进行 布局 
self.number of years = Intvar() 
years = Entry(win, width=15, textvariable=self.number of years) 


# 创 建 Entry 对 象 
years.grid(row=2, column=1, padx=5, pady=5, sticky="w") 
# 使 用 grid 进行 布局 


bt Calculate = Button (win，text=" 计 算 每 月 应 还 款 金额 "， 
command=self.Calculation) # 创 建 button 对 象 ， 用 于 提交 数据 
bt Calculate.grid (row=3, column=0, columnspan=2, pady=5) 


# 使 用 grid 进行 布局 ， 横 跨 两 列 


lab payment = Label (win，text=" 每 月 应 还 款 金额 :") # 创 建 Label 标签 
lab payment .grid(row=4, column=0, padx=5, pady=5, sticky="e") 
# 使 用 gria 进行 布局 
self.number of repay = DoubleVar() 
payment = Entry (win, width=15, state="readonly", 
textvariable=self.number of repay) 首创 建 Entry 对 象 
payment .grid (row=4, column=1, padx=5, pady=5, sticky="w") 
# 使 用 grid 进行 布局 


win.mainloop() 


def Calculation (self) : 
trYy: 
Principal = float(self.number of ent.get()) 
year rate = float(self.number of rate.get()) 
month rate = year rate / 12 # 转 换 成 月 利率 
years = float (self.number of years.get()) 
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months = years * 12 # 转 换 成 月 数 
sum = (Principal * (month rate/100) * pow((1 + month rate/100), 


months))\ 


/ (pow((1 + month rate/100)，months)-1) # 月 还 款 计算 公式 
self.number of repay.set (round (sum，2)) # 保 留 两 位 小 数 并 输出 
except: 
messagebox.showerror (title=" 提 示 "，message=" 输 入 错误 ， 请 重新 输入 ") 


MortgageCalculator () 


运行 后 的 界面 如 图 10-1(b) 所 示 。 


10.4 案例 实 训 : 设计 一 个 查看 文件 目录 的 程序 


本 节 案 例 将 结合 前 面 几 章 所 学 内 容 ， 并 结合 GUI 编程 ， 以 面向 对 象 的 方法 设计 一 个 查 
看 文件 目录 的 程序 。 该 程序 完成 的 功能 如 下 。 


(1) 
2 
(3) 
(4) 
G) 
(0) 


默认 显示 当前 目录 下 的 所 有 目录 和 文件 。 

双击 某 目 录 ， 能 够 显示 该 目录 下 的 所 有 目录 和 文件 。 

可 以 通过 滚动 条 查看 不 在 可 视 区 域内 的 文件 。 

按钮 Clear: 清除 列表 框 中 的 所 有 内 容 。 

按钮 LS: 配合 路 径 输入 文本 框 ， 判 断路 径 是 否 合法 ， 如 果 合法 则 列 出 所 有 文件 。 
按钮 Quit: 结束 运行 。 


查看 文件 目录 程序 的 具体 代码 如 下 : 


import os 
from time import sleep 
from tkinter import * 


class DirList (object): 


def init (self,initdir=None): 

self.top=Tk () 

self.top.title ("目录 查看 器 ") 

self.title label=Label (self.top,text=" 目 录 查 看 器 1.0 版 ") 

self.title label .pack() 

self.cwd=stringVar (self .top) 

self.cwd lable=Label (self.top, fg="'Red',font=(" 宋体 ' LO "bord uy 

self.cwd lable.pack() 

self.dirs frame=Frame (self .top) 

self.sbar=Scrollbar (self.dirs frame) 

self.sbar.pack (side=RIGHT, fill=Y) 

self.dirs listbox=Listbox(self.dirs frame,height=15,width=50, 
yscrollcommand=self.sbar.set) 

self.dirs listbox.bind('<Double-1>',self.setDirAndGo) 

self.dirs listbox.pack (side=LEFT, fil1l=BOTH) 

self.dirs frame.pack() 


self.dirn=Entry (self.top,width=50, textvariable=self .cwd) 
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self.dirn.bind("<Return>",self.doLS) 
self.dirn.pack() 


self.bottom frame=Frame (Self.top) 

self.ret=Button (self.bottom frame,text="Return", 
command=self.RetDir,activeforeground="'white', 
activebackground="'Gray') 

self.clr=Button (self.bottom frame,text="Clear", 
command=self.clrDir,activeforeground="'white', 
activebackground='Gray') 

self.1s=Button (self.bottom frame, text="List", 
command=self .doLS,activeforeground='white', 
activebackground="'Gray') 

self.quit=Button (self.bottom frame, text="Quit", 
command=self.top.quit,activeforeground='white', 
activebackground="'Gray') 

self.clr.pack (side=LEFT) 

self.ret.pack (side=LEFT) 

self.1s.pack (side=LEFT) 

self.quit.pack (side=LEFT) 

self.bottom frame.pack() 


if initdir: 
self.cwd.set (os.curdir) 
self.doLs () 


def RetDir (self,ev=None) : 
dirlist=os.listdir (root) 
dirlist.sort() 
os.chdir (root) 
self.dirs listbox.delete(0,END) 
self.dirs listbox.insert (END,os.curdir) 
self.dirs listbox.insert (END,os.pardir) 
for eachfile in dirlist: 

self.dirs listbox.insert (END,eachfile) 

self.cwd.set (os.curdir) 
self.dirs listbox.config(selectbackground='Gray') 


def clrDir (self,ev=None) : 
#self.cwd.set('') 
self.dirs listbox.delete (first=0, 1ast=END) 


def setDirAndGo (self, ev=None): 

self.last=self.cwd.get () 
self.dirs listbox.config(selectbackground="'red') 
代 R 

check=self.dirs listbox.get (self.dirs listbox.curselection()) 
except: 

check="" 
if not check: 

check=os .Curdir 

#check is the selected item for file or directory 


.So 


self.cwd.set (check) 


self.doLs () 


def doLs (self,ev=None): 


error="" 
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self.cwd lable.config(text=self.cwd-get()) 
tdir=self.cwd.get ()#get the current working directory 


a TOE Cail: 


tdir=os.curdir 
if not os.path.exists (tdir) : 
error=tqdir+' :未 找到 该 文件 ' 
elif not os.path.isdir (tdir): 
error=tdir+" :该 文件 不 是 文件 夹 " 


if error:#if error occured 


print (error) 


self.cwd.set (error) 
self.top.update () 


sleep (2) 


if not (hasattr(self,'last') and self.last): 


self.last=os.curdir 
self.cwd.set (self.1last) 


self.dirs listbox.config(selectbackground='Gray') 


self.top.update () 


return 


self .cwd.set ("目录 加 载 中 ..") 


self.top.update () 
上 > 


dirlist=os.listdir(tdir) 


dirlist.sort() 

os .chdir (tdir) 
except: 

so th 


dirlist=o0s.listdir (tdir) 


dirlist :sort 
os.chdir (tdir) 


self.dirs listbox.delete(0,END) 


self.dirs listbox.insert (END,os.curdir) 
self.dirs listbox.insert (END,os.pardir) 


for eachfile in dirlist: 


self.dirs listbox.insert (END,eachfile) 


self.cwd.set (os.curdir) 


self.dirs listbox.config(selectbackground="Gray") 


def main(): 


人 


global root 

root = os.getcwd() 
print (root) 
d=DirList (root) 
mainloop () 


name ==' main 
main() 
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运行 上 面 的 代码 后 ， 显 示 的 程序 界面 如 图 10-38 所 示 。 
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本 章 小 结 


在 本 章 中 ， 介 绍 了 如 何 使 用 Python 语言 进行 GUI 编程 ， 介 绍 了 Tkinter 模块 的 Label 
组 件 、Button 组 件 、Messagebox 组 件 、Entry 组 件 、Radiobutton 组 件 、Checkbutton 组 件 、 
Text 组 件 、Listbox 组 件 、Menu 组 件 、Scale 组 件 等 ， 并 讲解 了 如 何 使 用 网 格 布局 管理 器 让 
这 些 组 件 更 好 地 展现 在 窗 体 中 。 

在 实际 的 应 用 中 ， 一 个 有 着 良好 界面 的 程序 能 提供 更 好 的 用 户 体验 。 合 理 地 运用 各 个 
组 件 ， 合 理 地 进行 布局 设计 ， 才 能 实现 多 种 多 样 的 用 户 界面 。 


习 题 


1. 填空 题 


(1) Python 的 常用 GUI 工具 有 ( kA 和 ) 和 ( ) 等 。 

(2) Python 图 形 用 户 界 面 程序 一 般 包 含 一 个 顶层 窗口 ， 也 称 为 ( ) 或 ( 状 

(3) Tkinter 提供 了 三 种 不 同 的 几何 布局 管理 器 : ( js ) 和 ( )， 用 
将 组 件 放置 到 窗 体 的 指定 位 置 ， 从 而 组 织 和 管理 子 配 件 在 父 组 件 中 的 布局 方式 。 

(4) 通过 组 件 的 ( ) 和 ( ) 属 性 ， 可 以 设置 组 件 的 宽度 和 高 度 。 

(5) 通过 Button 组 件 的 ( ) 属 性 可 以 设置 其 显示 的 位 图 ， 自 定义 位 图 为 ( ) 

(6) ( ) 控 件 用 于 选择 同一 组 单 选 按钮 中 的 一 个 单 选 按 钮 (不 能 同时 选择 多 个 )， 按 
钮 上 可 显示 文本 ， 也 可 显示 图 像 。 

(7) ( ) 用 于 显示 对 象 列 表 ， 并 允许 用 户 选择 一 个 或 多 个 项 。 

(8) Tkinter 模块 中 的 ( ) 通 常用 于 实现 通用 消息 框 的 功能 ，( ) 用 于 实现 列 
表 框 的 功能 ，( ) 用 于 实现 文本 框 的 功能 。 
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2. 选择 题 
(1) 在 Tkinter 中 ， 下 面 的 (  ”) 语 句 用 来 创建 只 读 文 本 框 。 
A. messagebox B. Label C. Entry D. Text 


(2) 弹出 消息 框 是 图 形 界 面 的 一 个 基本 功能 ， 使 用 tkinter.messagebox 模块 的 
askretrycancel() 可 以 弹出 一 个 包含 ( 。”) 的 疑问 消息 框 。 
A B. “ 重 试 ” 和 “取消 ” 
C. “确定 ”和 “取消 ” D.“ 重 置 ”和 “取消 
(3) 使 用 grid 布局 管理 器 的 sticky 属性 对 组 件 进行 调整 时 ， 如 果 想 让 组 件 沿 水 平和 垂 
直 两 个 方向 被 拉 伸 ， 以 填充 整个 单元 格 ， 应 该 将 sticky 的 值 设 定 为 ( )。 
A.ns B. we C. center D. nsew 
3. 问答 题 
(1) grid 是 Tkinter 模块 中 的 三 种 布局 管理 器 之 一 ， 其 中 sticky 属性 的 值 可 取 N、S、 
W、 忆 之 一 或 其 组 合 ， 你 怎样 理解 其 含义 ? 
(2) 需要 将 窗口 win 的 尺寸 设置 为 1024x768， 最 小 800x600， 最 大 1440x900， 应 怎 
样 设 置 ? 
4. 实验 操作 题 
应 用 面向 对 象 的 编程 方法 创建 一 个 窗口 (300x120)， 窗 口中 布置 两 个 按钮 ， 其 中 一 个 按 
钮 用 于 关闭 窗口 ， 另 一 个 按钮 用 于 切换 执行 传 入 的 两 个 函数 sta() 和 sto()。 部 分 代码 已 经 给 
出 ， 请 补充 类 Window 的 代码 : 
import time 


import tkinter as tk 


class Window: 





def sta() : 
print('start.') 
return True 

def sto() : 
print('stop.') 
return True 


if name =="' main ': 
import sys, os 


Ww = Window (staFunc=sta, stoFunc=sto) 

Ww.staIco = os.path.join(sys.exec prefix, 'DLLs\pyc.ico') 
W.stoIco = os.path.join(sys.exec prefix, 'DLLs\py.ico') 
Ww.loop() 
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本 章 要 点 


(1) 多 进程 与 多 线程 的 概念 。 

(2) 多 进程 与 多 线程 的 区 别 。 

(3) 进程 间 通 信 技 术 。 

(4) 进程 池 。 

(5) thread 锁 。 

学 习 目 标 

(1) 了 解 多 进程 与 多 线程 的 主要 区 别 。 

(2) 掌握 多 进程 编程 方法 。 

(3) 掌握 多 线程 编程 方法 。 

(4) 掌握 进程 间 通 信 技 术 queue 消息 队列 和 pip 管道 的 应 用 方法 。 

(5) 掌握 进程 池 的 使 用 方法 。 

(6) 掌握 thread 锁 的 相关 知识 。 

本 章 主要 介绍 如 何 使 用 Python 实现 程序 的 并 发 运行 。 并 发 可 分 为 多 线程 和 多 进程 两 
种 ， 本 章 将 对 这 两 种 技术 的 区 别 和 使 用 方法 做 详细 介绍 。 


11.1 多 进程 与 多 线程 


11.1.1 为何 需要 多 进程 (或 多 线程 )/ 为 何 需要 并 发 


随 着 计算 机 技术 的 不 断 发 展 ， 多 核 计算 机 已 经 走 入 每 个 人 的 工作 和 生活 中 。 在 购买 计 
算 机 时 ， 四 核心 八 线程 、 八 核心 十 六 线程 等 已 经 成 为 评价 一 台 计 算 机 优 劣 的 标准 。 很 多 人 
只 是 知道 ， 核 心 越 多 ， 程 序 运行 的 速度 越 快 ， 因 为 核心 越 多 ， 能 同时 运行 的 程序 就 越 多 。 
其 实 ， 这 背后 运用 的 就 是 多 任务 (multitask) 技 术 。 

在 同一 个 时 间 里 ， 同 一 个 计算 机 系统 中 如 果 人 允许 两 个 或 两 个 以 上 的 进程 处 于 运行 状 
态 ， 这 便 是 多 任务 。 多 任务 带 来 的 好 处 是 明显 的 ， 比 如 用 户 可 以 边 听 歌 、 边 上 网 、 边 打 
印 ， 而 这 些 任 务 之 间 丝 毫 不 会 相互 干扰 。 使 用 多 进程 (或 者 多 线程 ) 技 术 ， 可 以 大 大 地 提高 
计算 机 的 运行 效率 。 


11.1.2 ”多 进程 与 多 线程 的 区 别 


进程 (process) 是 程序 在 计算 机 上 的 一 次 执行 活动 。 当 运行 一 个 程序 时 ， 实 质 上 就 启动 
了 一 个 进程 。 显 然 ， 程 序 是 死 的 (静态 的 )， 进 程 是 活 的 (动态 的 )。 进 程 可 以 分 为 系统 进程 和 
用 户 进程 。 线 程 (threagd) 是 程序 中 一 个 单一 的 顺序 控制 流程 。 进 程 是 一 个 相对 独立 的 、 可 调 
度 的 执行 单元 ， 是 系统 独立 调度 和 分 派 CPU 的 基本 单位 ( 指 运行 中 程序 的 调度 单位 )。 进 程 
是 资源 分 配 的 最 小 单位 ， 线 程 是 CPU 调度 的 最 小 单位 。 
我 们 通常 使 用 的 计算 机 中 只 有 一 个 CPU， 也 就 是 说 只 有 一 颗 “ 心 ”， 要 让 它 一 “ 心 ” 
多 用 ， 同 时 运行 多 个 进程 ， 就 必须 使 用 并 发 技术 。 实 现 并 发 技术 相当 复杂 ， 最 容易 理解 的 
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是 “时 间 片 轮转 进程 调度 算法 ”。 其 基本 思想 可 以 简要 地 描述 如 下 : 在 操作 系统 的 管理 
下 ， 所 有 正在 运行 的 进程 轮流 使 用 CPU， 每 个 进程 允许 占用 CPU 的 时 间 非 常 短 ( 比 如 10 
毫秒 )， 这 样 ， 用 户 根 本 感觉 不 到 CPU 是 在 轮流 为 多 个 进程 服务 ， 就 好 像 所 有 的 进程 都 在 
不 间断 地 运行 一 样 。 但 实际 上 ， 在 任何 一 个 时 刻 ， 有 且 仅 有 一 个 进程 占用 CPU。 

如 果 一 台 计 算 机 有 多 个 CPU， 情 况 就 不 同 了 ， 如 果 进程 数 小 于 或 等 于 CPU 数 ， 则 不 
同 的 进程 可 以 分 配给 不 同 的 CPU 来 运行 。 这 样 ， 多 个 进程 就 是 真正 同时 运行 的 ， 这 便 是 
并 行 。 但 如 果 进 程 数 大 于 CPU 数 ， 则 仍然 需要 使 用 并 发 技术 。 在 Windows 中 ， 进 行 CPU 
分 配 是 以 线程 为 单位 的 ， 一 个 进程 可 能 由 多 个 线程 组 成 ， 这 时 情况 更 加 复杂 ， 但 简单 地 说 
有 如 下 关系 : 

@ ”总 线程 数 三 CPU 数量 : 并 行 运行 。 

@ 总 线程 数 >CPU 数量 : 并 发 运行 。 

并 行 运行 的 效率 显然 高 于 并 发 运行 。 所 以 在 多 CPU 的 计算 机 中 使 用 多 任务 技术 ， 可 
以 明显 地 提高 运行 效率 。 

那么 ， 在 实际 应 用 中 ， 到 底 是 该 用 多 线程 还 是 该 用 多 进程 呢 ? 答案 是 ， 好 坏 是 相对 
的 ， 需 要 根据 实际 情况 进行 选择 。 表 11-1 根据 不 同 的 应 用 方向 ， 对 多 进程 和 多 线程 进行 了 
简略 的 对 比 。 














表 11-1 多 进程 和 多 线程 对 比 


多 线程 总 结 
数据 共享 复杂 ， 需 要 用 IPC; | 因为 共享 进程 数据 ， 数 据 共享 简 
数据 共享 、 同 步 数据 是 分 开 的 ， 同 步 简单 单 ， 但 也 是 因为 这 个 原因 ， 导 致 同 | 各 有 优势 


对 比方 面 


步 复杂 
占用 内 存 多 ， 切 换 复 杂 ， | 占用 内 存 少 ， 切 换 简 单 ，CPU 利用 
FE、CPU 线程 
由 CPU 利用 率 低 率 高 人 
创建 、 销 筑 、 韦 杂 ，j 
创建 、 销 毁 、 切 换 生生 全 的 全 全 和 全 创建 、 销 毁 、 切 换 简 单 ， 速 度 很 快 ”| 线程 占 优 
编程 、 调 试 编程 简单 ， 调 试 简单 编程 复杂 ， 调 试 复杂 进程 占 优 


可 靠 性 一 个 线程 挂 掉 将 导致 整个 进程 挂 掉 ”| 进程 占 优 

适应 于 多 核 、 多 机 分 布 式 ; 
一 台 机 器 不 够 时 ， 扩 展 到 多 | 适应 于 多 核 分 布 式 进程 占 优 
台 机 器 比较 简单 


从 表 11-1 中 可 以 看 出 如 下 几 点 。 

(1) 需要 频繁 创建 、 销 毁 的 优先 用 线程 。 这 种 原则 最 常见 的 应 用 就 是 Web 服务 器 了 ， 
来 一 个 连接 建立 一 个 线程 ， 断 了 就 销毁 线程 。 要 是 用 进程 ， 创 建 和 销毁 的 代价 是 很 难 承受 的 。 

(2) 需要 进行 大 量 计算 的 优先 使 用 线程 。 大 量 计 算 要 耗费 很 多 CPU 时 间 ， 而 且 需 要 频 
繁 切换 ， 这 种 情况 下 线程 是 最 合适 的 。 这 种 原则 最 常见 的 应 用 是 图 像 处 理 、 算 法 处 理 。 

(3) 强 相关 的 处 理 用 线程 ， 弱 相关 的 处 理 用 进程 。 什 么 叫 强 相关 、 弱 相关 ? 理论 上 很 
难 定义 ， 给 个 简单 的 例子 就 明白 了 。 一 般 的 Server 需要 完成 如 下 任务 : 消息 收发 、 消 息 处 
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理 。“ 消 息 收 发 ”和 “消息 处 理 ” 就 是 弱 相 关 的 任务 ， 而 “消息 处 理 ” 里 面 可 能 又 分 为 
“消息 解码 ”、“ 业 务 处 理 ”， 这 两 个 任务 相对 来 说 ， 相 关 性 就 要 强 多 了 。 因 此 “消息 收 
发 ”和 “消息 处 理 ” 可 以 分 进程 设计 ，“ 消 息 解码 ”、“ 业 务 处 理 ” 可 以 分 线程 设计 。 当 
然 这 种 划分 方式 不 是 一 成 不 变 的 ， 也 可 以 根据 实际 情况 进行 调整 。 

(4) 可 能 要 扩展 到 多 机 分 布 的 用 进程 ， 多 核 分 布 的 用 线程 。 

(5) 都 满足 需求 的 情况 下 ， 用 你 最 熟悉 、 最 拿手 的 方式 。 至 于 “数据 共享 、 同 步 ”、 
“编程 、 调 试 ”、“ 可 靠 性 ”这 几 个 维度 的 所 谓 的 “复杂 ”、“ 简 单 ” 应 该 怎么 取舍 呢 ? 
只 能 说 : 没有 明确 的 选择 方法 ， 选 择 原则 是 : 如 果 多 进程 和 多 线程 都 能 够 满足 要 求 ， 那 么 
选择 你 最 熟悉 、 最 拿手 的 那个 。 

需要 提醒 的 是 : 虽然 给 出 了 这 么 多 的 选择 原则 ， 但 实际 应 用 中 基本 上 都 是 “进程 + 线 
程 ” 的 结合 方式 ， 千 万 不 要 陷入 一 种 非 此 即 彼 的 误 
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11.2.1 进程 的 概念 


进程 是 计算 机 中 的 程序 关于 某 数据 集合 上 的 一 次 运行 活动 ， 是 系统 进行 资源 分 配 和 调 
度 的 基本 单位 ， 是 操作 系统 结构 的 基础 。 在 早期 面向 进程 设计 的 计算 机 结构 中 ， 进 程 是 程 
序 的 基本 执行 实体 ， 在 当代 面向 线程 设计 的 计算 机 结构 中 ， 进 程 是 线程 的 容器 。 程 序 是 指 
令 、 数 据 及 其 组 织 形式 的 描述 ， 进 程 是 程序 的 实体 。 

进程 的 概念 主要 有 两 点 : 第 一 ， 进 程 是 一 个 实体 ， 每 一 个 进程 都 有 它 自 己 的 地 址 空 
间 ， 一 般 情 况 下 ， 包 括 文本 区 域 (text region)、 数 据 区 域 (data region) 和 堆栈 区 域 (stack 
region)， 文 本 区 域 存 储 处 理 器 执行 的 代码 ; 数据 区 域 存 储 变量 和 进程 执行 期 间 使 用 的 动态 
分 配 的 内 存 ， 堆 栈 区 域 存储 着 活动 过 程 调用 的 指令 和 本 地 变量 。 第 二 ， 进 程 是 一 个 “执行 
中 的 程序 ”。 程 序 是 一 个 没有 生命 的 实体 ， 只 有 处 理 器 赋予 程序 生命 时 (操作 系统 执行 
之 )， 它 才能 成 为 一 个 活动 的 实体 ， 我 们 称 其 为 进程 。 


11.2.2 ”进程 的 特征 


一 个 进程 具有 如 下 特征 。 

@ 动态 性 : 进程 的 实质 是 程序 在 多 道 程序 系统 中 的 一 次 执行 过 程 ， 进 程 是 动态 产 
生 、 动 态 消亡 的 。 

@ ”并 发 性 :任何 进程 都 可 以 同 其 他 进程 一 起 并 发 执行 。 

@ 独立 性 : 进程 是 一 个 能 独立 运行 的 基本 单位 ， 同 时 也 是 系统 分 配 资源 和 调度 的 独 
立 单位 。 

@ 异步 性 : 进程 间 的 相互 制约 ， 使 进程 具有 执行 的 间断 性 ， 即 进程 按 各 自 独 立 的 、 
不 可 预知 的 速度 向 前 推进 。 

@ ”结构 特征 : 进程 由 程序 、 数 据 和 进程 控制 块 三 部 分 组 成 。 

多 个 不 同 的 进程 可 以 包含 相同 的 程序 : 一 个 程序 在 不 同 的 数据 集 里 就 构成 不 同 的 进 


.( 316 \， 


第 11 章 多 进程 与 多 线程 全 


程 ， 能 得 到 不 同 的 结果 ， 但 是 执行 过 程 中 ， 程 序 不 能 发 生 改 变 。 
11.2.3 ”进程 的 状态 


前 面 我 们 讲 过 ， 在 实际 运行 中 ， 多 个 进程 轮流 使 用 CPU。 进 程 执行 时 的 间断 性 ， 决 定 
了 进程 可 能 具有 多 种 状态 。 事 实 上 ， 运 行 中 的 进程 可 能 具有 以 下 三 种 基本 状态 。 

(1) 就 绪 状 态 (Ready)。 

进程 已 获得 除 处 理 器 外 的 所 需 资源 ， 等 待 分 配 处 理 器 资源 ， 只 要 分 配 了 处 理 器 进程 就 
可 执行 。 就 绪 进 程 可 以 按 多 个 优先 级 来 划分 队列 。 例 如 ， 当 一 个 进程 由 于 时 间 片 用 完 而 进 
入 就 绪 状 态 时 ， 排 入 低 优先 级 队列 ;， 当 进程 由 VO 操作 完成 而 进入 就 绪 状 态 时 ， 排 入 高 优 
先 级 队列 。 

(2) 运行 状态 (Running)。 

进程 占用 处 理 器 资源 ， 处 于 此 状态 的 进程 的 数目 小 于 或 等 于 处 理 器 的 数目 。 在 没有 其 
他 进程 可 以 执行 时 (如 所 有 进程 都 在 阻塞 状态 )， 通 常会 自动 执行 系统 的 空闲 进程 。 

(3) 阻塞 状态 (Blocked)。 

由 于 进程 等 待 某 种 条 件 ( 如 IO 操作 或 进程 同步 )， 在 条 件 满足 之 前 无 法 继续 执行 。 该 
事件 发 生前 ， 即 使 把 处 理 器 资源 分 配给 该 进程 ， 也 无 法 运行 。 

进程 间 的 状态 切换 如 图 11-1 所 示 。 


总 等 待 某 个 事件 发 生 
x 
准 


某 个 事件 已 经 发 生 


图 11-1 进程 间 的 状态 切换 


进程 间 状 态 切换 的 控制 流程 要 点 如 下 。 

(1) 程序 只 有 作为 进程 时 才能 在 系统 中 运行 。 因 此 ， 为 使 程序 能 运行 ， 就 必须 为 它 创 
建 进程 。 一 旦 操作 系统 发 现 了 要 求 创建 新 进程 的 事件 后 ， 便 调用 进程 创建 原 语 create() 创 建 
一 个 新 进程 。 如 果 进 程 就 绪 队 列 能 够 接纳 新 进程 ， 便 将 新 进程 插入 到 就 绪 队 列 中 ， 这 时 的 

(2) 当 处 理 器 空闲 时 ， 就 会 开始 运行 该 进程 的 指令 ， 这 时 的 程序 处 于 “运行 状态 ”。 

(3) 当 正 在 执行 的 进程 请 求 操作 系统 提供 服务 时 ， 由 于 某 种 原因 (请 求 系统 服务 、 启 动 
某 种 操作 、 新 数据 尚未 到 达 、 无 新 工作 可 做 等 )， 操 作 系统 不 能 立即 满足 该 进程 的 要 求 时 ， 
该 进程 只 能 转变 为 阻塞 状态 来 等 待 ， 一 旦 要 求 得 到 满足 后 ， 进 程 就 被 唤醒 。 

(4) 当 被 阻塞 的 进程 所 期 待 的 事件 出 现时 (如 IO 完成 或 者 其 所 期 待 的 数据 已 经 到 
达 )， 则 由 有 关 进 程 首 先 把 被 阻塞 的 进程 从 等 待 该 事件 的 阻塞 队列 中 移出 ， 将 其 状态 由 “ 阻 
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塞 ” 改 为 “就 绕 ”， 然 后 再 将 其 插入 到 就 绪 队 列 中 。 
(5) 当 进 程 顺利 运行 完成 后 或 者 由 于 异常 等 原 





因 被 操作 系统 终止 时 ， 该 进程 就 会 被 从 


内 存 中 移 除 或 者 标 为 “被 终止 ”状态 ， 系 统 回 收 全 部 资源 ， 返 回 给 父 进程 或 者 操作 系统 。 


11.3 Multiprocessing 





Multiprocessing( 多 进程 ) 是 Python 提供 的 非常 好 用 的 多 进程 包 ， 用 户 只 需要 简单 地 定 


义 一 个 函数 ，Python 就 会 自动 地 完成 其 他 的 所 有 事 
间 通 信 、 数 据 共 享 、 不 同形 式 的 同步 ， 提 供 了 包括 
种 组 件 。 合 理 运 用 这 些 组 件 ， 可 以 轻松 地 完成 单 进 和 
11.3.1 创建 进程 Process 模块 


创建 进程 的 类 为 : 


情 。Multiprocessing 支持 子 进程 、 进 程 
Process、Queue、Pipe、Lock 在 内 的 各 
旦 到 并 发 执行 的 转换 。 


class multiprocessing.Process (group=None, target=None, name=None, 


args=(), kwargs={}) 


其 中 group 为 None， 它 的 存在 是 为 了 兼容 threading.Thread，target 表示 调用 对 象 ， 
name 为 别名 ，args 表示 调用 对 象 的 位 置 参数 元 组 ，kwargs 表示 调用 对 象 的 字典 。 


【 例 11-1】 创建 函数 并 将 其 作为 单个 进程 : 


import multiprocessing 
import time 


def worker 1 (interval): 
print ("worker 1 start work") 
time.sleep (interval) 
print ("worker 1 end") 


if name ==" main ": 
P = multiprocessing.Process (target = 
p.start () 


worker 1, args = (3,)) 


print ("p.pid:", p.pid) #p.pid 为 当前 进程 的 标识 符 ， 以 整数 表示 


print ("p.name:", p.name) 


#p.name 为 当前 进程 的 名 称 ， 以 Process-n 表示 ， 其 中 n 为 整数 


print ("p.is alive:", p.is alive()) 


#p.is_alive 方法 测试 进程 是 否 处 于 运行 状态 ， 结 果 为 True 或 False 


输出 结果 : 
p.pid: 13336 
p. name: Process-1 
p. is_alive: True 
worker_l] start work 
worker_l1 end 
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由 于 IDLE 不 能 很 好 地 支持 多 进程 输出 ， 所 以 本 例 及 以 下 各 例 的 运行 环境 均 为 


在 上 面 的 例子 中 ， 定 义 了 一 个 worker_1 函数 ， 然 后 在 主 函 数 中 通过 Process 创建 进程 
并 调用 。start() 方 法 开始 运行 ， 其 中 p.pid 为 查看 当前 进程 的 进程 标识 符 ，p.name 为 查看 当 





import multiprocessing 
import time 


def worker 1(interval) : 
print ("worker 1") 
time.sleep (interval) 
print ("end worker 1") 


def worker 2(interval): 
print ("worker 2") 
time.sleep (interval) 
print ("end worker 2") 


def worker 3(interval): 
print ("worker 3") 
time.sleep (interval) 
print ("end worker 3") 


if name ==" main ": 


pl = multiprocessing.Process (target 
multiprocessing.Process (target 
multiprocessing.Process (target 


p2 
p3 


pl.start () 
p2.start () 
p3.start () 


前 进程 名 称 ，p.is_alive 方法 测试 进程 是 否 处 于 运行 状态 。 如 果 进 程 还 没有 执行 完 ， 则 会 返 
回 True， 如 果 进 程 已 经 执行 完 ， 则 返回 False。 
【 例 11-2】 创 建 函 数 并 将 其 作为 多 个 进程 : 


worker 1，args = (2,)) 
worker 2, args 
worker 3, args 


(3,)) 
(4,)) 


print ("The number of CPU is:" + str(multiprocessing.cpu count())) 


for p in multiprocessing.active children(): 


print("child p.name:" + p.name + "\tp.id" + str(p.pid)) 


输出 结果 : 
The number of CPU is:4 
child  p.name:Process-2 p. id10148 
child  p.name:Process-3 p. id5224 
child bp.name:Process-1 p. id7292 
Worker_2 
worker_1 
worker_3 
end worker_1 
end worker_ 2 
end worker_ 3 


.(319\. 


I wm 多》 Pyhon 程序 设计 实用 教程 


上 述 代码 中 使 用 multiprocessing.cpu_count() 函 数 查看 当前 计算 机 的 CPU 数量 ， 并 通过 
语句 multiprocessing.active_children() 和 for 循环 的 结合 使 用 ， 帮 助 我 们 清晰 地 查看 当前 活动 
的 进程 数 。 当 然 ， 也 可 以 利用 Process 创建 多 个 进程 pl1、p2、p3， 再 通过 start0 运 行 。 不 
难看 出 ， 运 行 结果 以 worker 2、worker 1、worker 3 的 顺序 输出 ， 说 明 这 三 个 进程 间 是 并 
发 执行 的 ， 所 以 每 次 开始 时 的 输出 顺序 可 能 有 所 不 同 。 





11.3.2 ”守护 进程 Daemon 


守护 进程 (Daemon) 是 一 种 运行 在 后 台 的 特殊 进程 ， 它 独立 于 控制 终端 并 且 周 期 性 地 执 
行 某 种 任务 或 等 待 处 理 某 些 发 生 的 事件 。 在 Linux 中 ， 系 统 与 用 户 进行 交流 的 每 个 界面 都 
称 为 终端 ， 从 某 终端 开始 运行 的 每 一 个 进程 都 会 依附 于 这 个 终端 ， 因 此 ， 这 个 终端 被 称 为 
这 些 进程 的 控制 终端 ， 当 控制 终端 被 关闭 的 时 候 ， 相 应 的 进程 都 会 自动 关闭 。 但 是 守护 进 
程 却 能 突破 这 种 限制 ， 它 脱离 于 终端 而 在 后 台 运 行 。 它 脱离 终端 的 目的 是 为 了 避免 进程 在 
运行 过 程 中 的 信息 在 任何 终端 上 显示 ， 并 且 进 程 也 不 会 被 任何 终端 所 产生 的 终端 信息 所 打 
断 。 它 从 被 执行 的 时 候 开 始 运转 ， 直 到 整个 系统 关闭 才 退 出 。 

【 例 11-3】 为 进程 加 上 daemon 属性 : 


import multiprocessing 
import time 





def worker (interval) : 
print ("work start:{0}".format (time.ctime())) 
time.sleep (interval) 
print ("work end:{0}".format (time .ctime())) 


if name ==" main ": 
P = multiprocessing.Process (target = worker, args = (3,)) 
P.daemon = True 
p.start () 
print ("end!") 
输出 结果 : 
end! 

之 所 以 出 现 这 种 结果 ， 是 因为 主 进程 在 运行 完 print(“end!”) 语 句 后 就 结束 了 ， 而 当 
daemon 属性 设置 为 True 时 ， 主 进程 结束 时 会 将 其 子 进程 连同 主 进程 一 同 结束 ， 而 不 论 其 
子 进程 是 否 已 经 运行 完毕 。 所 以 worker 进程 尚未 运行 完 就 被 终止 了 。 如 果 想 设置 daemon 
执行 完结 束 ， 就 需要 引入 join0 方 法 。 

join([timeout]) 方 法 : 阻塞 当前 进程 ， 等 待 被 调用 的 子 进程 结束 再 执行 主 进程 的 后 续 代 
码 。 其 中 timeout 参数 用 来 设置 最 长 等 待 时 间 ， 以 兔子 进程 运行 时 间 过 长 ， 影 响 其 他 代码 
的 运行 。 

【 例 11-4】 在 程序 中 加 入 join 方法 : 


import multiprocessing 
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def worker 1() : 
for i in range(5) : 
Print("worker 1:"+str(i)) 


def worker 2(): 
for i in range(5): 
print ("worker 2:"+str(i)) 


if name ==" main ": 
pl = multiprocessing.Process (target = worker 1, args 
p2 = multiprocessing.Process (target = worker 2, args 
pil-.3tartdy 
pl.join() 
p23startl} 


(0)) 
()) 


worker_1:0 
worker_1:1 
worker_1:2 
worker_1:3 
worker_1:4 
worker_2:0 
worker_2:1 
worker_2:2 
worker_2:3 


worker_2:4 


通过 上 面 的 例子 可 以 知道 ， 如 果 没 有 加 join0 语 句 ， 两 个 函数 的 输出 结果 应 该 是 重生 
输出 的 。 但 加 入 join0 语 句 后 ， 它 对 后 面 的 代码 进行 阻塞 ， 只 有 当 worker 1 进程 完全 结束 
后 才 会 执行 后 续 代 码 。 
所 以 只 要 在 例 11-3 的 p.startO) 语 句 后 加 上 pjoin0)， 结 果 就 会 变 为 ; 
work start:Wed Aug 23 15:52:45 2017 
work end:Wed Aug 23 15:52:48 2017 
end! 


11.3.3 ”进程 间 通 信 技 术 Queue 和 Pipe 


1. Queue 通信 

Queue 是 安全 的 多 进程 队列 ， 使 用 Queue 可 以 实现 多 进程 之 间 的 数据 传递 ， 使 用 其 中 
的 Queue.put() 方 法 可 以 将 数据 插入 到 消息 队列 中 。put0 方 法 还 有 两 个 可 选 参 数 : blocked 和 
timeout。blocked 默认 值 为 True， 此 时 若 timeout 为 正 值 ， 则 该 方法 会 阻塞 timeout 指定 的 
时 间 ， 直 到 该 队列 有 剩余 的 空间 ， 如 果 超 时 ， 会 抛 出 Queue .Full 异常 。 如 果 blocked 为 
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False， 但 该 Queue 已 满 ， 会 立即 抛 出 Queue Full 异常 。 

当 消 息 保存 到 消息 队列 中 时 ， 其 他 进程 可 以 通过 Queue.get0 方 法 从 消息 队列 中 取出 一 
个 消息 并 删除 。 同 样 地 ，get0 方 法 也 有 两 个 可 选 参 数 : blocked 和 timeout。 如 果 blocked 为 
True( 默 认 值 )， 并 且 timeout 为 正 值 ， 那 么 在 等 待 时 间 内 如 果 没 有 取 到 任何 元 素 ， 就 会 抛 出 
Queue.empty 异常 。 如 果 blocked 为 False， 有 两 种 情况 存在 ， 如 果 Queue 有 一 个 值 可 用 ， 
则 立即 返回 该 值 ， 否 则 ， 如 果 队 列 为 空 ， 则 立即 抛 出 Queue.empty 异常 。 

【 例 11-5】 使 用 Queue 进行 进程 间 通 信 : 


import multiprocessing 








def writer proc(q): 
人 EPs 
q-.put (1, block = False) 
except: 
pass 


def reader proc(q): 


EE 
print (gq.get (block = False)) 
except: 
pass 
if name ==" main ": 


q = multiprocessing.Queue() 
writer = multiprocessing.Process (target=writer proc, args=(q,)) 
writer.start () 


reader = multiprocessing.Process (target=reader proc, args=(q,)) 
reader.start () 


reader .join() 
writer.join() 
输出 结果 : 
1 
在 上 面 的 例子 中 ， 首 先 运行 一 个 进程 writer proc0， 向 Queue 消息 队列 中 写 入 一 个 值 
1， 消 息 通过 Queue 队列 被 进程 reader_proc0 读 取 并 打印 出 来 。 
2.，Pipe 管道 
Pipe 方法 返回 (conn1, conn2)， 代 表 一 个 管道 的 两 个 端 。Pipe 方法 有 duplex 参数 ， 如 果 
duplex 参数 为 True( 默 认 值 )， 那 么 这 个 管道 是 全 双 工 模式 ， 也 就 是 说 connl 和 conn2 均 可 
收发 。 若 duplex 为 False， 则 connl 只 负责 接收 消息 ，conn2 只 负责 发 送 消 息 。 
send 和 recv 方法 分 别 是 发 送 和 接收 消息 的 方法 。 例 如 ， 在 全 双 工 模式 下 ， 可 以 调用 
connl.send 发 送 消息 ， 调 用 connlrecv 接收 消息 。 如 果 没 有 消息 可 接收 ，recv 方法 会 一 直 
阻塞 。 如果 管道 已 经 被 关闭 ， 那 么 recv 方法 会 抛 出 EOFError 错误 。 
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【 例 11-6】 使 用 Pipe 管道 通信 : 


import multiprocessing 
import time 


def procl (pipe) : 
while True: 
for i in range(10000) : 
print ("send: %s" $(i)) 
pipe.send (i) 
time.sleep (1) 


def proc2 (pipe): 
while True: 
print ("proc2 rev:", pipe.recv()) 
time.sleep (1) 


def proc3 (pipe): 
while True: 
print ("proc3 rev:", pipe.recv()) 
time.sleep (1) 


if name ==" main ": 
pipe = multiprocessing.Pipe() 
pl = multiprocessing.Process (target=procl, args=(pipe[0],)) 
p2 = multiprocessing.Process (target=proc2, args=(pipe[1],)) 
p3 multiprocessing.Process (target=proc3, args=(pipe[1],)) 


pl.start() 
p2.5tart(y 
p3.start () 


输出 结果 : 


send: 0 
proc3 rev: 0 
send: 1 
proc2 rev: 1 
send: 2 
proc3 rev: 2 
send: 3 
proc2 rev: 3 
send: 4 
proc3 rev: 4 
send: 5 


a 


proc2 rev: 
send: 6 
proc3 rev: 6 
send: 7 
proc2 rev: 7 
send: 8 
proc3 rev: 8 
send: 9 
proc2 rev: 9 
send: 10 
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在 上 面 的 例子 中 ， 定 义 了 一 个 消息 发 送 进程 proc10，proc10 通 过 Pipe 管道 的 一 端 每 秒 
钟 向 消息 管道 中 发 送 一 个 消息 。 进 程 proc20 和 proc30 同 时 在 Pipe 管道 的 另 一 端 交 蔡 接收 
消息 。 


11.3.4 ”使 用 进程 池 pool 


在 利用 Python 进行 系统 管理 的 时 候 ， 特 别 是 同时 操作 多 个 文件 目录 ， 或 者 远程 控制 多 
台 主 机 时 ， 并 行 操作 可 以 节约 大 量 的 时 间 。 当 被 操作 对 象 数目 不 大 时 ， 可 以 直接 利用 
Multiprocessing 中 的 Process 动态 成 生 多 个 进程 。 十 几 个 还 好 ， 但 如 果 有 上 百 个 、 上 千 个 目 
标 ， 手 动 地 去 限制 进程 数量 却 又 太 过 繁 锁 ， 此 时 ， 可 以 发 挥 进程 池 的 功效 。 








pool 可 以 提供 指定 数量 的 进程 ， 供 用 户 调用 ， 当 有 新 的 请 求 提交 到 pool 中 时 ， 如 果 池 





还 没有 满 ， 那 么 就 会 创建 一 个 新 的 进程 用 来 执行 该 请 求 ， 但 如 果 池 中 的 进程 数 已 经 达到 规 
定 的 最 大 值 ， 那 么 该 请 求 就 会 等 待 ， 直 到 池 中 有 进程 结束 ， 才 会 创建 新 的 进程 来 执行 它 。 
【 例 11-7】 设 置 进程 池 个 数 : 


import multiprocessing 
import time 


.324 1 


def func (msg) : 


1 


print ("msg:", msg) 
time.sleep (3) 
print ("end") 


name ==" main ": 
pool = multiprocessing.Pool (processes = 3) 
for i in range(4): 
msg = ("hello %d" %$(i)) 
pool.apply async (func, (msg, )) 
# 维 持 执行 的 进程 总 数 为 processes， 当 一 个 进程 执行 完毕 后 ， 会 添加 新 的 进程 进去 


print ("Mark~ Mark~ Mark~") 
pool.close() 
pool.join() “ # 调 用 join 之 前 ， 先 调用 close 函数 ， 否 则 会 出 错 。 
# 执 行 完 close 后 ， 不 会 有 新 的 进程 加 入 到 pool，join 函数 等 待 所 有 子 进 程 结束 


print ("Sub-process (es) done.") 


执行 结果 : 


Mark™ Mark™ Mark™ 
msg: hello 0 
msg: hello 1 
msg: hello 2 


msg: hello 3 


end 


Sub-process (es) done. 
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从 上 面 的 输出 结果 可 以 看 到 ， 只 有 当前 三 个 进程 中 有 进程 执行 完毕 后 ， 才 会 将 新 的 进 
程 加 入 进程 池 执行 。 
【 例 11-8】 使 用 进程 池 ( 阻 塞 ): 


import multiprocessing 
import time 

















def func (msg) : 
print ("msg:", msg) 
time.sleep (3) 
print ("end") 


if name ==" main ": 
pool = multiprocessing.Pool (processes = 3) 
for i in range(4): 
msg = ("hello %d" $%$(i)) 
pool.apply (func, (msg, )) 
# 维 持 执行 的 进程 总 数 为 processes， 当 一 个 进程 执行 完毕 后 ， 会 添加 新 的 进程 进去 


print ("Mark~ Mark~ Mark~") 
pool.close() 
pool.join()  # 调 用 join 之 前 ， 先 调用 close () 函数 ， 否 则 会 出 错 。 执 行 完 close 后 ， 
# 不 会 有 新 的 进程 加 入 到 poo1，join () 函数 等 待 所 有 子 进程 结束 
print ("Sub-process (es) done.") 
执行 结果 : 
msg: hello 0 


msg: hello 1 
msg: hello 2 


msg: hello 3 
end 
Mark™ Mark™ Mark™ 
Sub-process (es) done. 
函数 解释 : 
@ apply_async(func[. args[. kwds[. callback]]]) 是 非 阻塞 的 ，apply(func[， args[, kwds]]) 
是 阻塞 的 (要 理解 区 别 ， 可 以 看 例 11-7 和 例 11-8 结果 的 区 别 )。 
@ close(0) 关 闭 pool， 使 其 不 再 接受 新 的 任务 。 
@ “terminate() 结 束 工作 进程 ， 不 再 处 理 未 完成 的 任务 。 
@ join0 使 主 进程 阻塞 ， 等 待 子 进程 的 退出 ，join 方法 要 在 close 或 者 terminate 之 后 
使 用 。 
执行 说 明 : 创建 一 个 进程 池 pool， 并 设 定 进程 的 数量 为 3，xrange(4) 会 相继 产生 4 个 
对 象 [0,， 1, 2, 3]， 这 4 个 对 象 被 提交 到 pool 中 ， 因 pool 指定 进程 数 为 3， 所 以 0、1、2 会 
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直接 送 到 进程 池 中 执行 ， 当 其 中 一 个 执行 完毕 后 才 空 出 一 个 进程 处 理 对 象 3， 所 以 输出 
“msg: hello 3” 出 现在 “end” 之 后 。 因 为 为 非 阻 塞 ， 主 函数 会 自己 执行 自己 的 ， 不 理 皮 进 
程 的 执行 ， 所 以 运行 完 for 循环 后 直接 输出 “Mark~ Mark~ Mark~”， 主 程序 在 pool.join() 
处 等 待 各 个 进程 的 结束 。 

【 例 11-9】 使 用 进程 池 ， 并 关注 结果 : 


import multiprocessing 
import time 








def func (msg) : 
print ("msg:", msg) 
time.sleep (3) 
print ("end") 
return "done" + msg 
if name ==" main ": 
pool = multiprocessing.Pool (processes=4) 
result = [] 
for i in range(3) : 
msg = "hello %d" g(i) 
result .append (pool.apply async (func, (msg, ))) 
pool.close() 
pool.join() 
for res in result: 
print (var reos getlyy 
print ("Sub-process (es) done.") 


执行 结果 : 
msg: hello 0 
msg: hello 1 
msg: hello 2 
end 
end 
end 
::: donehello 0 
::: donehello 1 
::: donehello 2 
Sub-process (es) done. 


从 上 面 的 运行 结果 可 以 看 到 ， 代 码 中 使 用 了 一 个 列表 result 收集 各 个 进程 返回 的 信 
息 ， 并 通过 for 循环 输出 收集 到 的 信息 。 
【 例 11-10】 使 用 多 个 进程 池 : 


import multiprocessing 
import os, time, random 


def Lee() : 
print ("\nRun task Lee-ss" $(0s.getpid())) #os.getpid() 获 取 当 前 的 进程 的 ID 
start = time.time() 
time.sleep (random.random() * 10) #random.random() 随 机 生成 0~1 之 间 的 小 数 
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end = 七 ime .time() 


print ('Task Lee, runs %0.2f seconds.' S$(end - start)) 


£f Marlon(): 
print ("\nRun task Marlon-%s" $(0s.getpid())) 
start = time.time() 
time.sleep (random.random() * 40) 
end=time .time () 
print ('Task Marlon runs %0.2f seconds.' $(end - start)) 


f Allen(): 
print ("\nRun task Allen-%s" $(0s.getpid())) 
start = time.time() 
time.sleep (random.random() * 30) 
end = time.time() 
print ('Task Allen runs %0.2f seconds.' g%g(end - start)) 


f Frank(): 

print ("\nRun task Frank-%s" %(0s.getpid())) 

start = time.time() 

time .sleep (random.random() * 20) 

end = 上 time .time() 

print ('Task Frank runs %0.2f seconds.' %(end - start)) 

name ==' main ': 
function list= [Lee, Marlon, Allen, Frank] 
print ("parent process %s" gs(os.getpid())) 


pool=multiprocessing.Pool (4) 
for func in function list: 
pool.apply async (func) #Pool 执行 函数 ，apply 执行 函数 ， 
# 当 有 一 个 进程 执行 完毕 后 ， 会 添加 一 个 新 的 进程 到 pool 中 


print ('Waiting for all subprocesses done...') 
pool.close() 
pool.join() ， # 调 用 join 之 前 ,一 定 要 先 调用 close () 函数 ， 否 则 会 出 错 ， 
#close () 执行 后 不 会 有 新 的 进程 加 入 到 pool，join 函数 等 待 所 有 子 进程 结束 


print ('All subprocesses done.') 


和 
行 结果 : 

parent process 4936 

Waiting for all subprocesses done... 


Run task Lee-2488 

Run task Marlon-6020 

Run task Allen-9912 

Run task Frank-10112 

Task Lee, runs 6.84 seconds. 
Task Frank runs 13. 61 seconds. 
Task Allen runs 15.01 seconds. 


Task Marlon runs 35.39 seconds. 
All subprocesses done. 
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在 上 面 的 例子 中 ,我们 通过 for 循环 同时 运行 了 4 个 进程 池 ， 每 个 进程 池 运行 一 个 进 
程 。 从 输出 结果 可 以 看 出 ， 各 个 进程 间 为 并 行 运 行 。 


11.4 ”多 线程 编程 


Python 通过 两 个 标准 库 thread 和 threading 提供 对 线程 的 支持 。thread 提供 了 低级 别 
的 、 原 始 的 线程 以 及 一 个 简单 的 锁 。threading 通过 对 thread 模块 进行 二 次 封装 ， 提 供 了 更 
方便 的 API 来 操作 线程 。 这 里 将 就 threading 模块 展开 详细 介绍 。threading 模块 的 常用 方法 
如 表 11-2 所 示 。 











表 11-2 threading 模块 的 常用 方法 


方法 名 称 说 明 
threading.Thread threading 模块 中 最 重要 的 类 之 一 ， 可 以 使 用 它 来 创建 线程 
threading.RLock 在 threading 模块 中 定义 的 锁 ， 人 允许 在 同一 线程 中 被 多 次 acquire 
threading.Lock 在 threading 模块 中 定义 的 锁 ， 不 允许 在 同一 线程 中 被 多 次 acquire 
threading.Condition 提供 了 比 Lock、RLock 更 高 级 的 功能 ， 能 够 控制 复杂 的 线程 同步 问题 
threading.Time 可 以 在 指定 时 间 间 隔 后 执行 某 个 操作 
threading.currentThread0) 获取 当前 的 线程 对 象 
threading.enumerateO 获取 当前 所 有 活动 线程 的 列表 
threading.settrace(func) 设置 一 个 跟踪 函数 ， 用 于 在 run0 执 行 之 前 被 调用 





11.4.1 Thread 对 象 


Thread 是 threading 模块 中 最 重要 的 类 之 一 ， 可 以 使 用 它 来 创建 线程 。 

有 两 种 方式 来 创建 线程 :一 种 是 通过 继承 Thread 类 ， 重 写 它 的 run() 方 法 ， 另 一 种 是 
创建 一 个 threading.Thread 对 象 ， 在 它 的 初始 化 函数 (_ init ) 中 将 可 调用 对 象 作为 参数 传 
入 。 下 面 分 别 举例 说 明 。 先 来 看 看 通过 继承 threading.Thread 类 来 创建 线程 的 例子 。 

【 例 11-11】 通 过 继承 threading.Thread 类 来 创建 线程 : 


import threading, time 
count = 0 


class Counter (threading.Thread) : 
def init (self, lock, threadName): 
"esummary: 初始 化 对 象 。 
eparam lock: 锁 对 象 。 
eparam threadName : 线程 名 称 
5 
super (Counter, self). init (name = threadName) 


# 注 意 : 一 定 要 显 式 地 调用 父 类 的 初始 化 函数 
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self.lock = lock 


def runl(self): 
'"''@summary: 重 写 父 类 run () 方法， 在 线程 启动 后 执行 该 方法 内 的 代码 


global count 
self.lock.acquire() 
for i in range(10000): 
count = count + 1 
self.lock.release () 


lock = threading.Lock() 


for i in range(5): 
Counter (lock, "thread-" + str(i)) .start() 


time.sleep (2) # 确 保 线程 都 执行 完毕 

print (count) 

执行 结果 : 

| 50000 

在 代码 中 ， 创 建 了 一 个 Counter 类 ， 它 继承 了 threading.Thread。 初 始 化 函数 接收 两 个 
参数 ， 一 个 是 锁 对 象 ， 另 一 个 是 线程 的 名 称 。 在 Counter 中 ， 重 写 了 从 父 类 继承 的 run 方 
法 ，ran 方法 将 一 个 全 局 变量 逐一 地 增加 到 10000。 在 接 下 来 的 代码 中 ， 创 建 了 5 个 
Counter 对 象 ， 分 别 调用 其 start 方法 ， 最 后 打印 结果 。 

这 里 要 说 明 一 下 run 方法 和 start 方法 ， 它 们 都 是 从 Thread 继承 而 来 的 ，run 方法 将 在 
线程 开启 后 执行 ， 可 以 把 相关 的 逻辑 写 到 run 方法 中 (通常 把 run 方法 称 为 活动 (Activity)); 
start 方法 用 于 启动 线程 。 

再 看 看 另外 一 种 创建 线程 的 方法 。 

【 例 11-12】 另 一 种 创建 线程 的 方法 : 


import threading, time 


count = 0 
lock = threading.Lock() 


def doAdqd(): 
"esummary: 将 全 局 变量 count 逐一 增加 10000 
i 
global count, lock 
lock.acquire() 
for i in range(10000): 
count 三 count+ 1 
lock.release() 


for i in range(5) : 
threading.Thread (target = doAdd, args = (), name = 'thread-' + 
str(i)).start() 
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time .sleep (2) # 确 保 线程 都 执行 完毕 


print (count) 

执行 结果 : 

50000 

在 这 段 代码 中 ， 定 义 了 方法 doAdd， 它 将 全 局 变量 count 逐一 地 增加 到 10000。 然 后 





创建 了 5 个 Thread 对 象 ， 把 函数 对 象 doAdd 作为 参数 传 给 它 的 初始 化 函数 ， 再 调用 
Thread 对 象 的 start 方法 ， 线 程 启动 后 ， 将 执行 doAdd 函数 。 


这 里 有 必要 介绍 一 下 threading.Thread 类 的 初始 化 函数 原型 : 
def init (self, group=None, target=None, name=None, args=(), 
kwargs={}) 
参数 group 是 预 留 的 ， 用 于 将 来 扩展 。 
参数 target 是 一 个 可 调用 对 象 ， 在 线程 启动 后 执行 。 
参数 name 是 线程 的 名 字 ， 默 认 值 为 Thread-N，N 是 一 个 数字 。 
参数 args 和 kwargs 分 别 表示 调用 target 时 的 参数 列表 和 关键 字 参 数 。 
Thread 类 还 定义 了 表 11-3 所 示 的 常用 方法 与 属性 。 
表 11-3 Thread 类 的 常用 方法 与 属性 





常用 方法 与 属性 说 明 
Thread getName0 | 用 于 获取 和 设置 线程 的 名 称 
Thread.setName() 


获取 线程 的 标识 符 。 线 程 标识 符 是 一 个 非 零 整数 ， 只 有 在 调用 了 start0 方 法 


Venda 之 后 ， 该 属性 才 有 效 ， 否 则 它 只 返回 None 
Thread.is_alive0 判断 线程 是 否 是 激活 的 (alive)。 从 调用 start0 方 法 启动 线程 ， 到 run() 方 法 执行 
ve 完毕 或 过 到 未 处 理 异常 而 中 断 这 段 时 间 内 ， 线 程 是 激活 的 





调用 Threadjoin 将 会 使 主 调 线程 阻塞 ， 直 到 被 调用 线程 运行 结束 或 超时 。 参 
Thread.join([timeout]) | 数 timeout 是 一 个 数值 类 型 ， 表 示 超 时 时 间 ， 如 果 未 提供 该 参数 ， 那 么 主 调 线 
程 将 一 直 阻 塞 到 被 调 线程 结束 





11.4.2 thread 锁 


在 threading 模块 中 定义 了 两 种 类 型 的 锁 : threading.Lock 和 threading.RLock， 它 们 之 


间 有 一 点 细微 的 区 别 ， 我 们 通过 比较 下 面 的 两 段 代 码 来 说 明 。 


【 例 11-13】 两 种 锁 方法 的 对 比 : 


import threading 

lock = threading.Lock() #Lock 对 象 
lock.acquire() 

lock.acquire() # 产 生 了 死 锁 


lock.release() 


第 11 章 “ 多 进程 与 9 线程 全 


lock.release() 


import threading 

rLock = threading.RLock() #RLock 对 象 

rLock.acquire() 

rLock.acquire() # 在 同一 线程 内 ， 程 序 不 会 阻塞 

rLock.release() 

rLock.release() 

这 两 种 锁 的 主要 区 别 是 : RLock 允许 在 同一 线程 中 被 多 次 acquire， 而 Lock 却 不 允许 
出 现 这 种 情况 。 


生 注意 : 如 果 使 用 RLock， 那 么 acquire 和 release 必须 成 对 出 现 ， 即 调用 了 n 次 
acquire， 必 须 调用 n 次 release 才能 真正 释放 所 占用 的 锁 。 


除了 上 面 的 两 种 锁 ，threading 模块 还 提供 了 另 一 种 更 加 实用 的 锁 Condition。 可 以 把 
Condition 理解 为 一 把 高 级 的 锁 ， 它 提供 了 比 Lock 和 RLock 更 高 级 的 功能 ， 人 允许 控制 复杂 
的 线程 同步 问题 。threading.Condition 在 内 部 维护 一 个 锁 对 象 (默认 是 RLock)， 可 以 在 创建 
Condition 对 象 的 时 候 把 锁 对 象 作为 参数 传 入 。Condition 也 提供 了 acquire 和 release 方法 ， 
其 含义 与 锁 的 acquire 和 release 方法 一 致 ， 其 实 它 只 是 简单 地 调用 内 部 锁 对 象 所 对 应 的 方 
法 而 已 。 

Condition 还 提供 了 如 下 方法 (特别 要 注意 ， 这 些 方 法 只 有 在 占用 锁 (acquire) 之 后 才能 调 
用 ， 否 则 将 会 报 RuntimeError 异常 )。 

(1) Condition.wait([timeout])。 

wait 方法 释放 内 部 所 占用 的 锁 ， 同 时 线程 被 挂 起 ， 直 至 接收 到 通知 被 唤醒 或 超时 (如 果 
提供 了 timeout 参数 的 话 )。 当 线程 被 唤醒 并 重新 占有 锁 的 时 候 ， 程 序 才 会 继续 执行 下 去 。 

(2) Condition.notify()。 

唤醒 一 个 挂 起 的 线程 (如 果 存 在 挂 起 的 线程 )。 注 意 notify0 方 法 不 会 释放 所 占用 的 锁 。 

(3) Condition.notify all()。 

唤醒 所 有 挂 起 的 线程 (如 果 存 在 挂 起 的 线程 )。 注 意 这 些 方法 不 会 释放 所 占用 的 锁 。 


11.5 “案例 实 训 : 捉迷藏 游戏 设计 


现在 通过 一 个 捉迷藏 游戏 程序 来 具体 介绍 threading 的 基本 使 用 。 假 设 这 个 游戏 由 两 个 
人 来 玩 ， 一 个 藏 (Hider)， 一 个 找 (Seeker)。 游 戏 的 规则 如 下 。 
(1) 游戏 开始 之 后 ，Seeker 先 把 自己 眼睛 蒙 上 ， 蒙 上 眼睛 后 ， 就 通知 Hider。 
(2) Hider 接收 通知 后 ， 开 始 找 地 方 将 自己 藏 起 来 ， 藏 好 后 再 通知 Seeker 找 。 
(3) Seeker 接收 到 通知 后 ， 就 开始 找 Hider。 
Hider 和 Seeker 都 是 独立 的 个 体 ， 在 程序 中 用 两 个 独立 的 线程 来 表示 ， 在 游戏 过 程 
两 者 之 间 的 行为 有 一 定 的 时 序 关系 ， 通 过 Condition 来 控制 这 种 时 序 关 系 : 

















二 


import threading，time 
class Seeker (threading.Thread): 
def init (self, cond, name): 
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super (Seeker, self). init () 
self.cond = cond 
self.name name 


def run(self): 
time .sleep (1) # 确 保 先 运行 Hider 中 的 方法 


self.cond.acquire() #b 
print (self.name + ": 我 已 经 把 眼睛 蒙 上 了 ') 
self.cond.notify() 
self.cond.wait() #c 
#f£ 
print (self.name + ': 我 找到 你 了 ~ ~') 
self.cond.notify() 
self.cond.release () 


#9g 
print (self.name + ': 我 赢 了 ') #h 


class Hider (threading.Thread) : 
def init (self, cond, name): 
super (Hider, self). init () 
self.cond = cond 
self.name = name 
def run(self) : 
self.cond.acquire () 


self.cond.wait() ”#a ， # 释 放 对 锁 的 占用 ， 同 时 线程 挂 起 在 这 里 ， 直 到 被 
notify 并 重新 占有 锁 
#d 
print (self.name + ': 我 已 经 藏 好 了 ， 你 快 来 找 我 吧 ' ) 
self.cond.notify() 
self.cond.wait () #e 
#h 
self.cond.release () 


print (self.name + ': 被 你 找到 了 ， 哎 ~') 


cond = threading.Condition() 
Seeker = Seeker(cond, 'seeker') 
hider = Hider(cond, 'hider') 
seeker.start () 

hider.start () 


运行 结果 : 
seeker: 我 已 经 把 眼睛 蒙 上 了 
hider: 我 已 经 藏 好 了 ， 你 快 来 找 我 吧 
seeker: 我 找到 你 了 “~ 
seeker: 我 赢 了 
hider: 被 你 找到 了 ， 哎 、 


本 章 小 结 


在 本 章 中 ， 我 们 主要 对 多 进程 和 多 线程 编程 及 其 相关 技术 进行 了 介绍 ， 并 通过 几 个 实 
际 的 应 用 来 帮助 读者 深入 了 解 多 进程 和 多 线程 的 使 用 方法 。 在 程序 中 合理 地 利用 这 两 种 技 
术 ， 不 但 可 以 大 幅 地 提升 程序 的 运算 效率 ， 而 且 可 以 使 程序 实现 变 得 更 加 轻松 。 
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你 ) 是 资源 分 配 的 最 小 单位 ，( ) 是 CPU 调度 的 最 小 单位 。 

(2) 运行 中 的 进程 可 能 具有 以 下 三 种 基本 状态 : ( )、( A 条 

(3) Multiprocessing 提供 了 两 种 进程 间 通 信 的 组 件 ， 分 别 是 ( ) 和 ( )， 其 中 
) 通 信 方 式 支持 全 双 工 模式 。 

(4) thread 锁 有 三 种 方法 ， 分 别 为 ( be 本 | 六 


2. 选择 题 

(1) 与 多 进程 相 比 ， 多 线程 在 ( ) 方 面 较为 占 优 。 
A. 可 靠 性 B. 数据 共享 、 同 步 
C. 创建 、 销 毁 、 切 换 D. 编程 、 调 试 


(2) 阅读 下 面 的 程序 ， 程 序 的 输出 结果 可 能 为 ( )。 


import multiprocessing 


def worker 11() : 

print ("worker 1") 
def worker 2(): 

print ("worker 2") 
def worker 3(): 

print ("worker 3") 


if name ==" main ": 


pl = multiprocessing.Process (target worker 1, args 


()) 


p2 = multiprocessing.Process (target = worker 2, args = ()) 

p3 = multiprocessing.Process (target = worker 3, args = ()) 

pl.start () 

p2.start () 

p3.start () 

A.worker 1 B. worker 2 C. worker 3 D. 都 有 可 能 
worker 2 worker 1 worker 2 
worker 3 worker 3 worker 1 

3. 问答 题 


(1) 什么 是 线程 ? 
(2) 什么 是 进程 ? 
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本 章 要 点 


(1) 计算 机 网 络 基础 知识 。 

(2) socket 通信 技术 。 

(3) urllib 库 及 其 使 用 。 

(4) 端口 扫描 器 编程 。 

(5) 简单 网 络 假 虫 编程 。 

学 习 目 标 

(1) 理解 基本 的 计算 机 网 络 知识 。 

(2) 掌握 socket 通信 技术 及 其 应 用 方法 。 

(3) 掌握 urllib 库 及 其 应 用 方法 。 

(4) 通过 端口 扫描 器 和 简单 的 网 络 爬 虫 例子 综合 应 用 所 学 内 容 。 


Python 语言 的 快速 编程 特性 ， 使 我 们 可 以 快速 地 编写 一 些小 型 工具 。 本 章 主 要 介绍 
Python 语言 在 计算 机 网 络 通信 方面 的 应 用 ， 首 先 介绍 一 些 计算 机 网 络 的 相关 知识 ， 然 后 通 
过 一 个 端口 扫描 器 程序 介绍 如 何 利用 socket 进行 计算 机 之 间 的 通信 ， 同 时 简要 介绍 Python 
提供 的 用 于 网 络 通信 的 大 量 的 库 ， 最 后 通过 一 个 简单 的 网 络 怜 虫 程序 介绍 Python 在 网 络 数 
据 收集 方面 的 应 用 。 














12.1 计算 机 网 络 基础 知识 


为 了 更 好 地 学 习 和 掌握 后 续 内 容 ， 本 章 一 开始 首先 简要 介绍 一 下 与 计算 机 网 络 相 关 的 
基础 知识 。 如 果 想 对 其 做 更 深入 的 了 解 ， 请 参考 有 关 计 算 机 网 络 的 文献 ， 例 如 《计算 机 网 
络 (第 5 版 )》、《 计 算 机 网 络 : 自 顶 向 下 方法 (第 6 版 )》、《 深 入 理解 计算 机 网 络 》、 
《TCP/IP 详解 》 等 (参考 文献 [22~25])。 

1. 计算 机 网 络 体系 结构 

计算 机 网 络 体系 结构 可 以 定义 为 网 络 协议 的 层次 划分 与 各 层 协议 的 集合 ， 同 一 层 中 的 
协议 根据 该 层 所 要 实现 的 功能 来 确定 。 各 对 等 层 之 间 的 协议 功能 由 相应 的 底层 提供 服务 完 
成 。 目 前 主要 的 计算 机 网 络 体系 结构 是 ISO/OSI 网 络 体系 结构 和 TCP/IP 协议 徐 。 两 种 体 
系 结构 都 采用 了 分 层 设计 和 实现 的 方式 ， 在 这 里 我 们 主要 介绍 TCP/IP 协议 簇 。 

传输 控制 协议 /网 间 协 议 (Transmission Control Protocol/Internet Protocol，TCP/IP) 定 义 了 
主机 如 何 连 入 因特网 及 数据 如 何在 它们 之 间 传 输 的 标准 。 从 字面 意思 来 看 ，TCP/IP 是 TCP 
和 了 P 协议 的 合 称 ， 但 实际 上 ，TCP/IP 协议 是 指 因特网 整个 TCP/IP 协议 徐 。 不 同 于 OSI 模 
型 的 七 个 分 层 ，TCP/IP 协议 参考 模型 把 所 有 的 TCP/IP 系列 协议 归 类 到 四 个 抽象 层 中 ， 应 
用 层 、 传 输 层 、 网 络 层 和 链 路 层 ， 通 信 过 程 如 图 12-1 所 示 。 

现 对 各 层 协 议 的 功能 做 如 下 说 明 。 

(1) 链 路 层 。 

链 路 层 对 应 OSI 模型 的 数据 链 路 层 和 物理 层 ， 负 责 向 网 络 媒体 发 送 和 接收 TCP/IP 数 
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据 包 。 
应 用 层 。 “| 应 用 程序 | [应 用 程序 | [应 用 程序 | [应 用 程序 | 
传输 层 
网 络 层 
链 路 层 
物理 传输 介质 
图 12-1 TCP/IP 协议 通信 过 程 
(2) 网 络 层 


网 络 层 是 整个 体系 结构 的 关键 部 分 ， 其 功能 是 使 主机 可 以 把 分 组 发 往 任 何 网 络 ， 并 使 
分 组 独立 地 传 向 目的 地 。 这 些 分 组 可 能 经 由 不 同 的 网 络 路 径 ， 到 达 的 顺序 和 发 送 的 顺序 也 
可 能 不 同 。 该 层 功能 与 OSI 参考 模型 的 网 络 层 功 能 相似 。 

(3) 传输 层 。 

传输 层 使 源 端 和 目的 端 机 器 上 的 对 等 实体 进行 会 话 。 在 这 一 层 定义 了 两 个 端 到 端的 协 
议 : 传输 控制 协议 (TCP) 和 用 户 数 据 包 协议 (UDP)。TCP 是 面向 连接 的 协议 ， 它 提供 可 靠 的 
报 文 传输 和 对 上 层 应 用 的 连接 服务 。 为 此 ， 除 了 基本 的 数据 传输 外 ， 它 还 有 可 靠 性 保证 、 
流量 控制 、 多 路 复 用 、 优 先 权 和 安全 性 控制 等 功能 。UDP 是 面向 无 连接 的 不 可 靠 传 输 协 
议 ， 主 要 用 于 不 需要 TCP 的 排序 和 流量 控制 等 功能 的 应 用 程序 。 

(4) 应 用 层 。 

应 用 层 是 TCP/IP 协议 的 最 高 层 ， 对 应 于 OSI 模型 的 应 用 层 、 表 示 层 和 会 话 层 。 应 用 
层 包 含 所 有 的 高 层 协议 ， 包 括 虚 拟 终端 协议 (Telneb、 文 件 传输 协议 ETP)、 简 单 邮件 传输 
协议 (SMTP)、 域 名 服务 (DNS)、 网 上 新 闻 传 输 协议 NNTP) 和 超 文 本 传输 协议 (HTTP) 等 。 
Telnet 允许 一 台 机 器 上 的 用 户 登 录 到 远程 机 器 上 ， 并 进行 工作 ; FTP 提供 有 效 地 将 文件 从 
一 台 机 器 移 到 另 一 台 机 器 上 的 方法 ，SMTP 用 于 电子 邮件 的 收发 ， DNS 用 于 把 主机 名 映射 
到 网 络 地 址 ，NNTP 用 于 新 闻 的 发 布 、 检 索 和 获取 ; HTTP 用 于 在 WWW 上 获取 主页 。 

2. 网 络 协议 

网 络 协议 是 计算 机 网 络 中 为 进行 数据 交换 而 建立 的 规则 、 标 准 或 约定 的 集合 。 网 络 协 
议 的 三 要 素 为 语法 、 语 义 和 时 序 。 

简单 地 讲 ， 语 义 表示 要 做 什么 ， 语 法 表示 要 怎么 做 ， 时 序 规定 了 各 种 事件 出 现 的 顺 
序 。 表 12-1 列 示 了 计算 机 网 络 中 常用 的 基本 概念 。 
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表 12-1 计算 机 网 络 中 常用 的 基本 概念 














基本 概念 解 释 
语义 语义 是 解释 控制 信息 每 个 部 分 的 意义 。 它 规定 了 需要 发 出 何 种 控 
制 信息 ， 以 及 完成 的 动作 与 做 出 什么 样 的 响应 
语法 语法 是 用 户 数据 与 控制 信息 的 结构 与 格式 ， 及 数据 出 现 的 顺序 
时 序 时 序 是 对 事件 发 生 顺 序 的 详细 说 明 (也 可 称 为 “同步 ”) 
域名 系统 DNS 是 由 解析 器 和 域名 服务 器 组 成 的 。 域 名 服务 器 是 指 保存 有 该 


(Domain Name System, DNS) 


网 络 中 所 有 主机 的 域名 和 对 应 瑟 地 址 ， 并 具有 将 域名 转换 为 卫 地 
址 功能 的 服务 器 





文件 传输 协议 
(File Transfer Protocol, FTP) 


超 文 本 传输 协议 (HyperText 
Transfer Protocol, HTTP) 


简单 邮件 传输 协议 (Simple Mail 
Transfer Protocol, SMTIP) 

地 址 解析 协议 (Address Resolution 
Protocol, ARP) 

简单 文件 传输 协议 (Trivial File 
Transfer Protocol, TFTP) 

简单 网 络 管理 协议 

(Simple Network Management 
Protocol, SNMP. 


Telnet 














户 数据 包 协 议 
(User Datagram Protocol, UDP) 





FTP 是 TCP/IP 协议 簇 中 的 协议 之 一 ， 用 于 在 Intemet 上 控制 文件 
的 双向 传输 。 同 时 ， 它 也 是 一 个 应 用 程序 。 用 户 可 以 通过 它 把 自 
己 的 PC 与 世界 各 地 所 有 运行 FTP 协议 的 服务 器 相连 ,访问 服务 
器 上 的 大 量程 序 和 信息 

HTTP 是 客户 端 浏览 器 或 其 他 程序 与 Web 服务 器 之 间 的 应 用 层 通 
信 协 议 。 在 Intemet 上 的 Web 服务 器 上 存放 的 都 是 超 文本 信息 ， 
客户 机 需要 通过 HTTP 协议 传输 所 要 访问 的 超 文本 信息 。HTTP 包 
含 命令 和 传输 信息 ， 不 仅 可 用 于 Web 访问 ， 也 可 以 用 于 其 他 因 特 
网 /内 联网 应 用 系统 之 间 的 通信 ， 从 而 实现 各 类 应 用 资源 超 媒体 访 
问 的 集成 

SMTP 是 一 种 TCP 协议 支持 的 提供 可 靠 且 有 效 的 电子 邮件 传输 的 
应 用 层 协议 。SMTP 是 建立 在 TCP 上 的 一 种 邮件 服务 ， 主 要 用 于 
传输 系统 之 间 的 邮件 信息 并 提供 与 来 信 有 关 的 通知 

实现 他 地 址 与 MAC 地 址 间 的 转换 


TFTP 是 TCP/IP 协议 簇 中 的 一 个 用 来 在 客户 机 与 服务 器 之 间 进 行 
简单 文件 传输 的 协议 ， 提 供 不 复 杂 、 开 销 不 大 的 文件 传输 服务 

该 协议 能 够 支持 网 络 管理 系统 ， 用 以 监测 连接 到 网 络 上 的 设备 是 
否 有 任何 引起 管理 上 关注 的 情况 





Telnet 协议 是 TCP/IP 协议 簇 中 的 一 员 ， 是 Intemet 远程 登录 服务 
的 标准 协议 和 主要 方式 

UDP 是 OSI 参考 模型 中 一 种 无 连接 的 传输 层 协议 ， 它 主要 用 于 不 
要 求 分 组 顺序 到 达 的 传输 中 ， 分 组 传输 顺序 的 检查 与 排序 由 应 用 
层 完成 ， 提 供 面向 事务 的 简单 不 可 靠 信息 传送 服务 





传输 控制 协议 (Transmission 
Control Protocol, TCP) 


TCP 是 一 种 面向 连接 的 、 可 靠 的 、 基 于 字 节 流 的 传输 层 通 信 协 议 





四 地 址 
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卫 地 址 是 人 P 协议 提供 的 一 种 统一 的 地 址 格式 ， 它 为 互联 网 上 的 每 

个 网 络 和 每 一 台 主机 分 配 一 个 逻辑 地 址 ， 以 此 来 屏蔽 物理 地 址 
的 差异 。 如 果 把 个 人 电脑 比 作 一 台电 话 ， 那 么 人 P 地 址 就 相当 于 电 
话 号 码 
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12.2 socket 通信 技术 
12.2.1 什么 是 socket 


socket 又 称 “ 套 接 字 ”， 应 用 程序 通常 通过 “ 套 接 字 ” 向 网 络 发 出 请 求 或 者 应 答 网 络 
请 求 ， 实 现 主机 间或 者 一 台 计 算 机 上 的 进程 间 通 信 。 

socket 非常 类 似 于 电话 插座 。 

以 一 个 国家 级 电话 网 为 例 ， 电 话 的 通话 双方 相当 于 相互 通信 的 两 个 进程 ， 区 号 是 它 的 
网 络 地 址 ; 区 内 一 个 单位 的 交换 机 相当 于 一 台 主机 ， 主 机 分 配给 每 个 用 户 的 局 内 号 码 相当 
于 socket 号 。 
任何 用 户 在 通话 之 前 ， 首 先 要 占有 一 部 电话 机 ， 相 当 于 申请 一 个 socket。 同 时 要 知道 
对 方 的 号 码 ， 相 当 于 对 方 有 一 个 固定 的 socket。 然 后 向 对 方 拨号 呼叫 ， 相 当 于 发 出 连接 请 
求 (假如 对 方 不 在 同一 区 内 ， 还 要 拨 对 方 区 号 ， 相 当 于 给 出 网 络 地 址 )。 假 如 对 方 在 场 并 空 
闲 ( 相 当 于 通信 的 另 一 主机 开机 且 可 以 接受 连接 请 求 )， 拿 起 电话 话 简 ， 双 方 就 可 以 正式 通 
话 ， 相 当 于 连接 成 功 。 双 方 通话 的 过 程 ， 是 一 方向 电话 机 发 出 信号 和 对 方 从 电话 机 接收 信 
号 的 过 程 (相当 于 向 socket 发 送 数据 和 从 socket 接收 数据 )。 通 话 结束 后 ， 一 方 挂 断 电话 机 
(相当 于 关闭 socket， 撤 消 连 接 )。 


12.2.2 ”连接 过 程 


根据 连接 启动 的 方式 以 及 本 地 套 接 字 要 连接 的 目标 ， 套 接 字 之 间 的 连接 过 程 可 以 分 为 
三 个 步 又: 服务 器 监听 ， 客 户 端 请求 ， 连 接 确 认 。 

(1) 服务 器 监听 是 指 服务 器 端 套 接 字 并 不 定位 具体 的 客户 端 套 接 字 ， 而 是 处 于 等 待 
连接 的 状态 ， 实 时 监听 网 络 状态 。 

(2) 客户 端 请 求 : 是 指 由 客户 端的 套 接 字 提出 连接 请 求 ， 要 连接 的 目标 是 服务 器 端的 
套 接 字 。 为 此 ， 客 户 端的 套 接 字 必须 首先 描述 它 要 连接 的 服务 器 的 套 接 字 ， 指 出 服务 器 端 
套 接 字 的 地 址 和 端口 号 ， 然 后 就 向 服务 器 端 套 接 字 提出 连接 请 求 。 

(3) 连接 确认 : 是 指 当 服务 器 端 套 接 字 监 听 到 或 者 说 接收 到 客户 端 套 接 字 的 连接 请 
求 ， 它 就 响应 客户 端 套 接 字 的 请 求 ， 建 立 一 个 新 的 线程 ， 把 服务 器 端 套 接 字 的 描述 发 给 客 
户 端 ， 一 旦 客户 端 确认 了 此 描述 ， 连 接 就 建立 好 了 。 而 服务 器 端 套 接 字 继续 处 于 监听 状 
态 ， 继 续 接收 其 他 客户 端 套 接 字 的 连接 请 求 。 


12.2.3 socket 模块 


Python 提供 了 两 个 基本 的 socket 模块 ， 一 个 是 socket， 它 提供 了 标准 的 BSD socket 
API; 另 一 个 是 socketServer， 它 提供 了 服务 器 中 心 类 ， 可 以 简化 网 络 服务 器 的 开发 。 
socket 模块 的 部 分 类 方法 如 表 12-2 所 示 。 
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表 12-2 socket 模块 的 部 分 类 方法 


说 明 
创建 并 返回 一 个 新 的 socket 对 象 
将 使 用 点 号 分 隔 的 王 地 址 字符 串 转换 成 一 个 完整 的 域名 
将 主机 名 解析 为 一 个 使 用 点 号 分 隔 的 耳 地 址 字符 串 
它 返 回 一 个 包含 三 个 元 素 的 元 组 ， 从 左 到 右 分 别 是 给 定 地 址 
的 主机 名 、 同 一 IP 地 址 的 可 选 的 主机 名 的 一 个 列表 、 关 于 
同一 主机 的 同一 接口 的 其 他 人 P 地 址 的 一 个 列表 (列表 可 能 都 
是 空 的 ) 


类 方法 
socket.socket(family, type[.proto]) 





socket.getfqdn(name) 





socket.gethostbyname(hostname) 

















socket.gethostbyname ex(name) 





socket.gethostbyaddr(address) 人 
耳 地 址 字符 串 


它 要 求 一 个 服务 名 (如 “telnet* 或 ‘ftp”) 和 一 个 协议 (如 ‘tcp’ 或 
“udp”)， 返 回 服务 所 使 用 的 端口 号 
从 现 有 的 文件 描述 符 创建 一 个 socket 对 象 


socket.getservbyname(service, protocol) 





socket.fromfd(fd, family, type) 


12.2.4 socket 函数 


socket 函数 是 一 种 可 用 于 根据 指定 的 地 址 族 、 数 据 类 型 和 协议 来 分 配 一 个 套 接 字 及 其 
所 用 资源 的 函数 ， 表 12-3 为 常用 的 socket 函数 。 
表 12-3 常用 的 socket 函数 


Socket 函数 | 说 明 


服务 端 socket 函数 





将 套 接 字 绑 定 到 地 址 ， 在 AF_ INET 下 ， 以 元 组 (host, 
ort) 的 形式 表示 地 址 
开始 监听 TCP 传 入 连接 。backlog 指定 在 拒绝 连接 之 


s.bind(address) 

















s.listen(backlog) 前 ， 操 作 系 统 可 以 挂 起 的 最 大 连接 数量 。 该 值 至 少 为 
1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 
接受 TCP 连接 并 返回 (conn，address)， 其 中 conn 是 新 
s.accept() 的 套 接 字 对 象 ， 可 以 用 来 接收 和 发 送 数 据 。address 
是 连接 客户 端的 地 址 
客户 端 Socket 函数 
连接 到 address 处 的 套 接 字 。 一 般 address 的 格式 为 元 
s.connect(address) 组 (hostname，port)， 如 果 连 接 出 错 ， 则 返回 











socket.error 错误 
功能 与 connect(address) 相 同 ， 但 是 成 功 返 
返回 ermo 的 值 








0， 失 败 





5 








s.connect ex(address) 
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续 表 
socket 函数 说 明 
公共 socket 函数 
接受 TCP 套 接 字 的 数据 。 数 据 以 字符 串 形式 返回 ，bufsize 指定 
s.recv(bufsize[,flag]) 要 接收 的 最 大 数据 量 。flag 提供 有 关 消 息 的 其 他 信息 ， 通 常 可 以 
忽略 
发 送 TCP 数据 。 将 string 中 的 数据 发 送 到 连接 的 套 接 字 。 返 回 
s.send(string[,flag]) 
值 是 要 发 送 的 字 节 数量 ， 该 数量 可 能 小 于 string 的 字 节 大 小 
完整 发 送 TCP 数据 。 将 string 中 的 数据 发 送 到 连接 的 套 接 字 ， 
s.sendall(string[,flag]) 但 在 返回 之 前 会 尝试 发 送 所 有 数据 。 成 功 返回 None， 失 败 则 抛 
出 异常 
接受 UDP 套 接 字 的 数据 。 与 recv0 类 似 ， 但 返回 值 是 (data, 
s.recvfrom(bufsize[.flag]) address)。 其 中 data 是 包含 接收 数据 的 字符 串 ，address 是 发 送 数 


s.Sendto(string[,flag],address) 


s.close() 

s.getpeername() 

s.getsockname() 
s.setsockopt(level,optname,value) 


s.getsockopt(level,optname[.buflen]) 


s.settimeout(timeout) 


s.gettimeout() 


据 的 套 接 字 地 址 
发 送 UDP 数据 。 将 数据 发 送 到 套 接 字 ，address 是 形式 为 (ipaddr, 
porb) 的 元 组 ， 指 定 远 程 地 址 。 返 回 值 是 发 送 的 字 节 数 
关闭 套 接 字 

返回 连接 套 接 字 的 远程 地 址 。 返 回 值 通常 是 元 组 (ipaddr, port) 
返回 套 接 字 自己 的 地 址 。 通 常 是 一 个 元 组 (ipaddr, port) 

设置 给 定 套 接 字 选项 的 值 

返回 套 接 字 选 项 的 值 

设置 套 接 字 操作 的 超时 期 ，timeout 是 一 个 浮 点 数 ， 单 位 是 秒 。 
值 为 None 表示 没有 超时 期 

返回 当前 超时 期 的 值 ， 单 位 是 秒 ， 如 果 没 有 设置 超时 期 ， 则 返回 


None 

















s.fileno0) 返回 套 接 字 的 文件 描述 符 
如 果 flag 为 0， 则 将 套 接 字 设 为 非 阻塞 模式 ， 否 则 将 套 接 字 设 为 
阻塞 模式 (默认 值 )。 非 阻塞 模式 下 ， 如 果 调 用 recv0 没 有 发 现任 
s.setblocking(flag) 
何 数据 ， 或 send0 调用 无 法 立即 发 送 数 据 ， 那 么 将 引起 
socket.error 异常 
s.makefile() 创建 一 个 与 该 套 接 字 相关 联 的 文件 


注意 : 


@ TCP 协议 发 送 数 据 时 ， 


已 建立 好 TCP 连接 ， 所 以 不 需要 指定 地 址 。UDP 是 无 连 


接 的 协议 ， 每 次 发 送 都 要 指定 是 发 给 谁 。 
@ 服务 器 端 与 客户 端 不 能 直接 发 送 列表 、 元 组 、 字 典 ， 需 要 使 用 repr(data) 将 其 字符 


串 化 。 


.AN. 


I mm Python 程序 设计 实用 教程 


12.2.5 ”socket 编程 思路 


1. 服务 器 端 编程 
(1) 创建 socket 对 象 ， 需 要 调用 socket 构造 函数 : 
socket = socket.socket (family,type) 


其 中 ，family 参数 代表 地 址 族 ， 可 以 为 AF INET 或 AF UNIX。AF_INET 族 包 括 
Intemet 地 址 ，AF_UNIX 族 用 于 同一 台 机 器 上 的 进程 间 通 信 。Type 参数 代表 套 接 字 类 型 ， 
可 为 SOCK_STREAM( 流 套 接 字 ) 和 SOCK_DGRAM( 数 据 包 套 接 字 )。 

(2) 将 socket 绑 定 到 指定 地 址 。 这 是 通过 socket 对 象 的 bind 方法 来 实现 的 : 


socket .bind (address) 


由 AF_INET 创建 的 套 接 字 ， 其 地 址 address 必须 是 一 个 双 元 素 元 组 ， 格 式 是 (host, 
port)，host 代表 主机 ，port 代表 端口 号 。 如 果 端 口号 正在 使 用 、 主 机 名 不 正确 或 端口 已 被 
保留 ，bind 方法 将 引发 socket.error 异常 。 

(3) 使 用 socket 套 接 字 的 listen 方法 接收 连接 请 求 : 


socket.1isten (backlog) 


backlog 指定 最 多 允许 多 少 个 客户 连接 到 服务 器 。 它 的 值 至 少 为 1。 收 到 连接 请 求 后 ， 
这 些 请 求 需要 排队 ， 如 果 队 列 满 ， 就 拒绝 请 求 。 
(4) 服务 器 套 接 字 通过 socket 的 accept 方法 等 待 客户 请 求 一 个 连接 : 


connection.address = socket.accept () 


调用 accept 方法 时 ，socket 会 进入 waiting 状态 。 客 户 请 求 连接 时 ， 该 方法 建立 连接 并 
返回 服务 器 。accept 方法 返回 一 个 含有 两 个 元 素 的 元 组 (connection，address)。 第 一 个 元 素 
connection 是 新 的 socket 对 象 ， 服 务 器 必须 通过 它 与 客户 通信 ; 第 二 个 元 素 address 是 客户 
的 Internet 地 址 。 

(5) ”处理 阶段 ， 服 务 器 和 客户 端 通过 send 和 recv 方法 通信 (传输 数据 )。 服 务 器 调用 
send， 并 采用 字 节 串 格式 (bytes) 向 客户 端 发 送信 息 。send 方法 返回 已 发 送 的 字符 个 数 。 服 
务 器 使 用 recv 方法 从 客户 端 接收 信息 。 调 用 recv 时 ， 服 务 器 必须 指定 一 个 整数 ， 它 对 应 
于 可 通过 本 次 方法 调用 来 接收 的 最 大 数据 量 。recv 方法 在 接收 数据 时 会 进入 blocked 状 
态 ， 最 后 返回 一 个 字符 串 ， 用 它 表 示 收 到 的 数据 。 如 果 发 送 的 数据 量 超过 了 recv 所 允许 
的 ， 数 据 会 被 截断 。 多 余 的 数据 将 缓冲 于 接收 端 ， 以 后 调用 recv 时 ， 多 余 的 数据 会 从 缓冲 
区 删除 (也 包括 自 上 次 调用 recv 以 来 ， 客 户 端 可 能 发 送 的 其 他 任何 数据 )。 

(6) 在 传输 结束 后 ， 服 务 器 调用 socket 的 close 方法 关闭 连接 。 


2. 客户 端 编程 
(1) 创建 一 个 socket 以 连接 服务 器 : 


socket = socket.socket (family, type) 
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(2) 使 用 socket 的 connect(0) 方 法 连接 服务 器 。 对 于 AF JINET 族 ， 连 接 格式 如 下 : 


Socket .connect (host, port) 


其 中 ，host 代表 服务 器 主机 名 或 耳 ，port 代表 服务 器 进程 所 绑 定 的 端口 号 。 如 连接 成 
客户 端 就 可 通过 套 接 字 与 服务 器 通信 ; 如 果 连 接 失 败 ， 会 引发 socket.error 异常 。 

(3) 处 理 阶 段 ， 客 户 和 服务 器 将 通过 send 方法 和 recv 方法 通信 。 

(4) 传输 结束 ， 客 户 通 过 调用 socket 的 close 方法 关闭 连接 。 


3. 服务 器 端 编 程 和 客户 端 编程 的 例子 


在 下 面 的 例子 中 ， 我 们 将 编写 一 个 简单 的 利用 socket 通信 的 程序 。 
【 例 12-1】socket 服务 端 编程 代码 (server.py): 


import socket #3 引入 socket 模块 
from time import ctime # 引 入 时 间 模 块 





bufsize = 1024 # 设 置 套 接 字 大 小 
host = '127.0.0.1' 坦 设置 IP 地 址 
port = 8100 间 设 置 端口 号 

address = (host, port) 


server sock = socket.socket (socket.AF INET, socket.SOCK STREAM) 
# 定 义 socket 类 型 

server sock.bind(address) # 绑 定 ip 地 址 和 端口 号 

server sock.listen(1) # 开 始 监听 


while True: 
print('waiting for connection...') 
clientsock,addr = server sock.accept() 
# 接 收 TCP 连接 请 求 ， 并 返回 客户 端的 IP 地 址 
print('received from :'，addr) # 输 出 客户 端的 地 址 
while True: 
data = str(clientsock.recv (bufsize), encoding="utf-8") 
# 接 收 客户 端 发 送 的 信息 ， 并 转换 为 字符 串 格式 
print(' received-->ss\nss' $$(ctime(), data)) # 输 出 收 到 的 信息 
data = input ("send-->") # 输 入 发 送 的 信息 
clientsock.send (bytes (data，encoding="utf-8") ) # 将 信息 发 送 给 客户 端 
clientsock.close ()  # 关 闭 连接 
server_sock.close() # 关 闭 服务 器 


【 例 12-2】socket 客户 端 编 程 代码 (client.py): 


from socket import * 
from time import ctime 


bufsize = 1024 埋设 置 套 接 字 大 小 
host = '127.0.0.1' 音 设置 IP 地 址 
port = 8100 埋设 置 端口 号 

address = (host, port) 
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client sock = socket (AF INET, SOCK STREAM) # 定 义 socket 类 型 
client sock.connect (address) 间 连 接 指定 的 IP 端口 


while True: 
data = input ("发 送 -->")  ## 输 入 要 发 送 的 信息 
if not data: ## 如 果 要 发 送 的 信息 为 空 ， 则 终止 链接 
break 
GESes 
client sock.send (bytes (data, encoding="utf-8")) 
# 将 要 发 送 的 信息 转换 为 pytes 格式 ， 并 发 送 
data = str(client sock.recv(bufsize), encoding="utf-8") 
井 接 收服 务 器 返回 的 信息 ， 并 转化 为 字符 格式 
print (' 收 到 -->%s\n%ss' s(ctime () ，data) ) # 输 出 收 到 的 信息 
client sock.close() # 关 闭 连接 


12.3 ”编写 一 个 端口 扫描 器 


前 面 我 们 通过 一 个 可 以 互 发 消息 的 socket 程序 初步 了 解 了 socket 是 如 何 访 


问 一 台 计 算 


机 的 。 然 而 ， 在 实际 应 用 中 ， 假 如 我 们 试图 使 用 某 个 端口 连接 远程 的 主机 ， 有 时 会 收 到 一 
个 “connection is refused”( 拒 绝 连 接 ) 消 息 。 大 多 数 情况 下 ， 收 到 这 个 信息 是 
机 中 的 端口 服务 停止 运行 了 。 在 遇 到 这 种 情况 时 ， 可 以 利用 socket 通信 技术 查看 端口 是 处 
于 开启 状态 还 是 处 于 监听 状态 。 
当然 ， 更 重要 的 是 可 以 用 来 测试 端口 的 可 访问 性 ， 因 为 这 为 我 们 提高 目标 主机 的 安全 


性 提供 了 保障 。 








因为 远程 主 


大 多 数 的 网 络 攻击 都 起 步 于 侦察 一 一 攻击 者 首先 通过 扫描 目标 服务 器 的 端口 号 ， 查 看 





# 有 端口 处 于 活跃 状态 ， 然 后 再 根据 端口 制定 攻击 计划 。 例 如 ， 最 近 爆 发 的 


晶 . 
是 否 














“比特 币 病 


毒 ”WannaCry， 就 是 利用 Windows 操作 系统 445 端口 存在 的 漏洞 进行 传播 的 ， 它 进行 自 
我 复制 ， 并 主动 传播 ， 是 一 种 典型 的 “勒索 ”类 病毒 。 被 该 病毒 入 侵 后 ， 用 户主 机 系统 内 


的 图 片 、 文 档 、 音 频 、 视 频 等 几乎 所 有 类 型 的 文件 都 将 被 加 密 ， 并 在 桌面 





框 ， 要 求 受害 者 支付 价值 数 百 美元 的 比特 币 到 攻击 者 的 比特 币 钱包 。 


所 以 ， 为 了 避免 服务 器 或 者 主机 被 黑客 攻击 ， 关 闭 可 能 被 攻击 的 端口 是 提 


全 性 的 必要 手段 。 


下 面 是 一 个 端口 扫描 器 的 例子 ， 用 于 检测 计算 机 的 哪些 端口 处 于 开启 状态 。 
【 例 12-3】 远 程 主机 端口 扫描 器 : 


import argparse 
import socket 
import sys 


def scan Ports (host， start port, end port): 
trYy: 
Sock = socket.socket (socket .AF INET,socket.SOCK STREAM) 
except socket.error as err msg: 


print ("Socket creation failed.Error code : " 


弹出 勒索 对 话 
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+ str(err msg[0]) + "Error message:™" + err msg[1]) 
sys.exit() 
人 EY 
remote ip = socket .gethostbyname (host) 
except socket.error as err msg: 
print (err msg) 
sys.exit () 


end port += 1 
for port in range (start port,end port): 
EY 
sock.connect ( (remote ip,port)) 
print ("Port ”+ str(port) + ”is open") 
sock.close() 
sock = socket.socket (socket.AF INET, socket.SOCK STREAM) 
except socket .error: 
pass 


if name =="' main ': 
parser = argparse.ArgumentParser (description="Remote Port Scanner ") 
parser.add argument ('--host', action="store", dest="host", 
default='localhost') 
parser.add argument ('--start-port', action="store", dest="start port", 
default=1, type=int) 
parser.add argument ('--end-port', action="store", dest="end port", 
default=100, type=int) 


given args = parser.parse args() 
host, start port, end port = given args.host, given args.start port, 
given args.end port 
scan ports (host, start port, end port) 
在 上 面 的 例子 中 ， 首 先 建立 一 个 scan_ports0 函 数 ， 该 函数 接收 三 个 参数 ， 主 机 名 ， 起 
始 端 口 和 终止 端口 。 
然后 建立 socket 套 接 字 ， 套 接 字 建立 成 功 后 ， 使 用 gethostbyname(O 函 数 找 出 主机 的 了 
地 址 。 
最 后 通过 一 个 for 循环 扫描 对 应 IP 地 址 主机 的 1~100 端口 号 。 如 果 连 接 成 功 ， 则 输出 


端口 号 ， 输 出 的 结果 可 能 如 下 : 
| Port 80 is open 
>>> 


一 般 情况 下 ，Web 服务 器 可 能 位 于 TCP 80 端口 ， 电 子 邮 件 服务 可 能 在 TCP 25 端口 ， 
FTP 服务 器 可 能 在 TCP 21 端口 。 在 扫描 出 所 有 开放 的 端口 后 ， 就 可 以 根据 实际 情况 关闭 
不 需要 的 端口 以 提高 服务 器 的 安全 性 了 。 


12.4 ”简单 网 络 拒 虫 的 实现 


Python 另 一 个 强大 的 方面 就 是 它 的 网 络 访问 和 网 络 数据 收集 功能 。 利 用 Python 自 带 的 
/S48\. 
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urllib 库 ， 我 们 可 以 轻松 地 访问 网 络 数据 并 将 其 保存 下 来 。 
12.4.1 ”什么 是 网 络 扑 虫 


网 络 爬 虫 (Web Crawler) 是 一 种 按照 一 定 的 规则 ， 自 动 地 抓 取 万 维 网 信息 的 程序 或 者 脚 
本 。 网 络 息 虫 又 称 为 网 页 蜂 蛛 、 网 络 机 器 人 ， 在 FOAF 社区 中 ， 人 们 更 经 常 称 其 为 网 页 追 
者 。 另 外 ， 它 还 有 一 些 不 常 使 用 的 名 字 ， 如 网 络 蚂蚁 、 自 动 索引 、 模 拟 程序 或 者 蠕虫 等 。 
网 络 怜 虫 广泛 地 应 用 于 搜索 引擎 领域 和 数据 收集 方面 。 像 Google 公司 和 百度 公司 这 
种 大 型 的 搜索 引擎 公司 更 是 拥有 自己 的 大 型 分 布 式 高 效率 网 络 爬 虫 。 开 源 的 网 络 爬 虫 框架 
有 Larbin、Heritrix、Scrapy、Crawler4j 等 ， 感 兴趣 的 读者 可 以 参阅 相关 的 文献 ， 因 篇 幅 所 
限 ， 本 书 不 再 一 一 介绍 。 本 节 仅 介 绍 Python 网 络 怜 虫 的 基础 模块 urllib 库 。 


12.4.2 ”浏览 网 页 的 过 程 




















在 介绍 urllib 库 之 前 ， 需 要 先 了 解 一 下 浏览 网 络 的 过 程 。 

使 用 浏览 器 浏览 网 页 时 ， 只 要 输入 网 页 地 址 或 者 单 击 网 络 链接 ， 就 会 弹出 一 个 网 站 的 
页 面 。 

例如 浏览 百度 图 片 的 网 站 时 ， 会 看 到 几 张 图 片 和 百度 图 片 的 搜索 框 ， 如 图 12-2 所 示 。 






12-2 ”浏览 器 解析 后 的 效果 


其 实 ， 这 个 过 程 是 用 户 在 输入 完 网 址 后 ， 浏 览 器 将 网 址 发 送 给 DNS 服务 器 ， DNS 服 
务 器 再 将 请 求 发 送 到 网 站 所 在 的 服务 器 。 网 站 所 在 的 服务 器 在 收 到 请 求 并 解析 后 ， 将 网 页 
的 HTML、JS、CSS 等 文件 返回 给 浏览 器 ， 再 经 过 浏览 器 的 解析 加 载 后 ， 用 户 才 可 以 看 到 
排版 工整 、 有 着 各 种 特效 的 页 面 。 而 服务 器 发 送 给 浏览 器 的 没有 被 解析 的 源 代码 可 能 是 如 
图 12-3 所 示 的 样子 。 
通过 上 述 分 析 我 们 不 难 想象 ， 可 以 使 用 urllib 库 来 模拟 浏览 器 访问 网 站 的 过 程 ， 通 过 
分 析 服 务 器 返回 的 源 代码 的 URL 和 媒体 信息 资源 ， 来 得 到 想 要 的 信息 。 

URL， 即 统一 资源 定位 符 (Uniform Resource Locator)， 也 就 是 常 说 的 网 址 ， 它 简洁 
表达 了 互联 网 上 可 得 到 的 资源 的 位 置 ， 同 时 也 指出 了 访问 该 资源 的 方法 ， 是 互联 网 上 标准 
资源 的 地 址 。 换 言 之 ， 互 联网 上 的 每 个 文件 都 有 一 个 唯一 的 URL， 它 包含 的 信息 指出 了 文 
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件 的 位 置 以 及 浏览 器 应 该 怎么 处 理 它 。 


onmouseover= ”this.className=" s_btn s_btn_on’ ”value=” 百 度 一 下 />》</span>》 < 
href=”javascript:void(0)”title= 上传 图 片 ， 搜 索 相 关 信 息 “> ed a st_ce 
src="//imgl. bdstatic. com/static/common/widget/shitu/ images/ camera new off # 

Src= /Limg2.bdstatic, com/ static/common/ widget/shitu/ images/ camera new on_4e 
息 </div> 《div class=”st_tips_arrow_in” id=” stTipArrowIn™ ></div> div class: 
style=”display:none”> 《<div id=”sthead”>《<span)》 识 图 《/span>》<img id=”sthelp” wi 
src="//img2. bdstatic. com/static/common/widget/shitu/images/mark b68ff2e. pn 
action="/pictureup/uploadshitu” method=“post” Ee <a id= "uploadIn 
nsclick=”p=1811102&tn=index&event_type=shitu. search. click&pos=upload > 本地- 
id=“dragtg”style=”display:none; ”> 提示 : 您 也 可 以 把 图 片 拖 到 这 里 《</div> 《inpul 
type=“hidden”> input name= “fm”value= "index” type= hidden > </form> 《form 
method= “get”name= “forml“>《“div id=”sturl”> 《span class=“stuwr “> 《input tyr 
class=”stuurl” name=”objurl”> /span> <span class=" stsb”> input type=”subr 
onmouseout="this. className= stsb2 “ onmouseover= his. className= stsb2 stst 
type="hidden”> input name=“rt” value=”0” type=” dden” > <input name= En 人 
name=“ct” value=”1” type=“hidden”’> 《input name=”stt” value=”0” type=”hidder 
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URL 的 格式 由 三 部 分 组 成 。 

(1) 第 一 部 分 是 协议 (或 称 为 服务 方式 )。 

(2) 第 三 部 分 是 存 有 该 资源 的 主机 人 P 地 址 (有 时 也 包括 端口 号 )。 

(3) 第 三 部 分 是 主机 资源 的 具体 地 址 ， 如 目录 和 文件 名 等 。 

疏 虫 疏 取 数据 时 必须 有 一 个 目标 URL 才 可 以 获取 数据 ， 因 此 ，URL 是 爬虫 获取 数据 
的 基本 依据 ， 准 确 地 理解 它 的 含义 ， 对 学 习 怜 虫 知识 有 很 大 的 帮助 。 


12.4.3 urllib 库 


Python 3 的 urllib 模块 是 一 堆 可 以 处 理 URL 的 组 件 集合 
urllib 模块 包含 了 4 个 子 模块 : 
@ urllib.request 








® urllib.error 
@ urllibparse 
@ urllib.rebotparser 


其 中 ， 主 要 使 用 request 打开 URL 来 访问 网 页 。 访 问 URL 的 代码 如 下 : 


urllib.request.urlopen (url, timeout) 


其 中 的 url 可 以 是 字符 串 格式 的 URL 地 址 ， 也 可 以 是 Request 对 象 。urlopen() 函 数 会 
返回 一 个 Request 对 象 ， 使 用 -read() 方 法 就 可 以 读 出 网 页 信息 了 。 

但 是 ， 使 用 read() 方 法 下 载 网 络 数据 时 ， 会 因为 对 方 网 速 慢 、 服 务 器 超时 等 原因 而 导 
致 “ 卡 死 ”。 解 决 这 一 问题 的 方法 有 多 种 ， 其 中 最 简单 的 就 是 设置 可 选 参数 timeout， 例 如 
用 timeout=10 可 将 超时 时 间 设 置 为 10 秒 。 此 外 ， 通 过 socket 模块 的 setdefaulttimeout() 函 
数 也 可 以 控制 超时 时 间 ， 例 如 ， 用 如 下 代码 也 可 将 超时 时 间 设 置 为 10 秒 : 


socket .setdefaulttimeout (10) 
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件 的 位 置 以 及 浏览 器 应 该 怎么 处 理 它 。 


onmouseover= ”this.className=" s_btn s_btn_on’ ”value=” 百 度 一 下 />》</span>》 < 
href=”javascript:void(0)”title= 上传 图 片 ， 搜 索 相 关 信 息 “> ed a st_ce 
src="//imgl. bdstatic. com/static/common/widget/shitu/ images/ camera new off # 

Src= /Limg2.bdstatic, com/ static/common/ widget/shitu/ images/ camera new on_4e 
息 </div> 《div class=”st_tips_arrow_in” id=” stTipArrowIn™ ></div> div class: 
style=”display:none”> 《<div id=”sthead”>《<span)》 识 图 《/span>》<img id=”sthelp” wi 
src="//img2. bdstatic. com/static/common/widget/shitu/images/mark b68ff2e. pn 
action="/pictureup/uploadshitu” method=“post” Ee <a id= "uploadIn 
nsclick=”p=1811102&tn=index&event_type=shitu. search. click&pos=upload > 本地- 
id=“dragtg”style=”display:none; ”> 提示 : 您 也 可 以 把 图 片 拖 到 这 里 《</div> 《inpul 
type=“hidden”> input name= “fm”value= "index” type= hidden > </form> 《form 
method= “get”name= “forml“>《“div id=”sturl”> 《span class=“stuwr “> 《input tyr 
class=”stuurl” name=”objurl”> /span> <span class=" stsb”> input type=”subr 
onmouseout="this. className= stsb2 “ onmouseover= his. className= stsb2 stst 
type="hidden”> input name=“rt” value=”0” type=” dden” > <input name= En 人 
name=“ct” value=”1” type=“hidden”’> 《input name=”stt” value=”0” type=”hidder 
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URL 的 格式 由 三 部 分 组 成 。 

(1) 第 一 部 分 是 协议 (或 称 为 服务 方式 )。 

(2) 第 三 部 分 是 存 有 该 资源 的 主机 人 P 地 址 (有 时 也 包括 端口 号 )。 

(3) 第 三 部 分 是 主机 资源 的 具体 地 址 ， 如 目录 和 文件 名 等 。 

疏 虫 疏 取 数据 时 必须 有 一 个 目标 URL 才 可 以 获取 数据 ， 因 此 ，URL 是 爬虫 获取 数据 
的 基本 依据 ， 准 确 地 理解 它 的 含义 ， 对 学 习 怜 虫 知识 有 很 大 的 帮助 。 


12.4.3 urllib 库 


Python 3 的 urllib 模块 是 一 堆 可 以 处 理 URL 的 组 件 集合 
urllib 模块 包含 了 4 个 子 模块 : 
@ urllib.request 








® urllib.error 
@ urllibparse 
@ urllib.rebotparser 


其 中 ， 主 要 使 用 request 打开 URL 来 访问 网 页 。 访 问 URL 的 代码 如 下 : 


urllib.request.urlopen (url, timeout) 


其 中 的 url 可 以 是 字符 串 格式 的 URL 地 址 ， 也 可 以 是 Request 对 象 。urlopen() 函 数 会 
返回 一 个 Request 对 象 ， 使 用 -read() 方 法 就 可 以 读 出 网 页 信息 了 。 

但 是 ， 使 用 read() 方 法 下 载 网 络 数据 时 ， 会 因为 对 方 网 速 慢 、 服 务 器 超时 等 原因 而 导 
致 “ 卡 死 ”。 解 决 这 一 问题 的 方法 有 多 种 ， 其 中 最 简单 的 就 是 设置 可 选 参数 timeout， 例 如 
用 timeout=10 可 将 超时 时 间 设 置 为 10 秒 。 此 外 ， 通 过 socket 模块 的 setdefaulttimeout() 函 
数 也 可 以 控制 超时 时 间 ， 例 如 ， 用 如 下 代码 也 可 将 超时 时 间 设 置 为 10 秒 : 


socket .setdefaulttimeout (10) 
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【 例 12-4】urlopen 方法 的 使 用 : 


import urllib.request as rq 


uop = rq.urlopen ("http://mini.eastday.com/", timeout=100) # 打 开 网 页 
data = uop.read(800) ， # 使 用 .read () 方法 获取 服务 器 返回 的 内 容 ， 返 回 800 个 字符 
print (data) 


输出 结果 如 下 所 示 : 


b’ Cidoctype html>\ndhtml lang="zh-cm-Hans-CN” >\nhead> \n <meta charset 
="utf-8” />\n <meta name= renderer” content="webkit” />\n <meta http 
-equiv="X-UA-Compatible” content=" IE=Edge, chrome=1” />\n META name="fi 
letype” content= 1”>\n NETA name="publishedtype” content="1”>\n qqE 
TA name="pagetype” content="2”>\n 《JETA name= catalogs” content="toutia 
o_PC" > meta name= “applicable-device” content="pc “>\n 《link href=” 
/assets/imnages/favicon. i ico” type="image/x-icon” rel= icon” />\n <link r 
el="canonical” href="http://nmini.eastday. cow/” />\n <title>\xe5\xad\xbd 
\xe6\x9d\xal\xe6\x96\xb0\xe9\x97\xbb, \xed\xb8\x9c\xe6\x96\xb9\xe5\xad\xb4d\ 
xe6\x9d\xal /title>\n <meta name="keywords” content="\xed\xbB8\x9c\xe6\x 
96\xb9\xe5\xad\xb4\xe6\x9d\xal, \xe5\xad\xbd\xe6\x9d\xal\xe6\x96\xb0\xe9\x9 
T\xbb, \xe5\xad\xb4\xe6\x9d\xal, \xe4\xbb\x8a\xe6\x97\xa5\xe6\x96\xb0\xe9\x9 
T\xbb\xe5\xad\xbd\xe6\x9d\xal, \xe5\xad\xb4\xe6\x9d\xal\xe?7\xbd\x91, \xe5\xa 
4\xbd\xe6\x9d\xal\xe6\x96\xb0\xe9\x97\xbb, \xed\xbb\x8a\xe6\x97\xa5\xe5\xad 
\xbd\xeb6\x9d\xal\xe6\x96\xb0\xe9\x97\xbb” />\n meta name=" description” 
content=" \xed4\xb8\x9c\xe6\x96\xb9\xe5\xad\xb4\xe6\x9d\xal\xeT\xbd\x91 \xed 
\xbB\x9c\xe6\x96\xb9\xeT\xbd\x91 \xe6\x97\x97\xed” 

>>> 


可 以 看 到 ， 返 回 的 代码 中 汉字 部 分 被 解析 为 “\xe7\x99\” 等 字符 ， 这 是 网 络 编码 问题 
引起 的 ， 只 需要 将 .read() 方 法 改 为 : read() decode(“utf-8”) 就 可 以 解决 这 一 问题 。 
网 络 编码 问题 解决 后 ， 实 际 运行 结果 如 下 : 


《1doctype html> 
<html lang="zh-cm-Hans-CN*> 
<head> 
<meta charset="utf-8” /> 
meta name="renderer” content="webkit” /> 
<meta http-equiv= X-UA-Compatible” content= "IE=Edge, chrome=1” /> 
《IETA nane= “filetype” content="1”> 
《ETA nane= “publishedtype” content= “1 ”> 
<IETA name="pagetype” content="2”> 
《IETA nanme=" catalogs” content="toutiao_] PC”> 
‘<meta name="applicable-device” content=" pe”> 
《link href=” /assets/inages/favicon. ico” type="image/x-icon” rel="icon” /> 
《link rel="canonical” href="http://mini.eastday. com/” 
《title》 头 条 新 闻 _ 东 方 头条 </title> 
《meta name="ke. words” content=” 东 方 头条 , 头条 新 闻 , 头条 , 今日 新 闻 头 条 , 头条 网 , 头 
条 新 闻 , 仿 日 头条 新 闻 ” 证 
descrip tion” content=" 二 我 二 
(二 2 性 名 次 总 全 当 分 关 你 的 类 委 要 好 ， 六 认 办 站 由 你 .就 要 你 
前 面 刚刚 提 到 ， Er timeoub 中 的 url 还 可 以 是 一 个 Request 对 象 。 使 用 Request 
对 象 可 以 同时 向 服务 器 发 送 URL、data、header 等 内 容 。 


建立 Request 对 象 的 方法 如 下 : 


urllib.request.Request (url, data=None, headers={},origin req host=None, 
unverifiable=False,method=None) 


其 中 前 面 三 个 参数 最 为 常用 : url 为 URL 字符 串 ; 可 选 参数 data(UTF-8 编码 格式 ) 是 向 
服务 器 传送 的 数据 ，headers 为 头 文件 字典 ， 主 要 用 于 设置 模拟 浏览 器 访问 ，headers 的 主 
要 参数 如 表 12-4 所 示 ; 后 面 三 个 参数 很 少 使 用 ， 一 般 分 别 设置 为 None、False、None。 


(a8. 
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表 12-4 headers 的 主要 参数 











参 数 说 明 
User-Agent 服务 器 或 Proxy 会 通过 该 值 来 判断 是 否 是 浏览 器 发 出 的 请 求 
在 使 用 REST 接口 时 ， 服 务 器 会 检查 该 值 ， 用 来 确定 HTTP 
Content-Type Body 中 的 内 容 该 怎样 解析 。 在 使 用 服务 器 提供 的 RESTful 或 
SOAP 服务 时 ，Content-Type 设置 错误 会 导致 服务 器 拒绝 服务 
application/xml 在 XML RPC， 如 RESTful/SOAP 调用 时 使 用 
application/json 在 JSON RPC 调用 时 使 用 








application/x-www-form-urlencoded ”| 浏览 器 提交 Web 表单 时 使 用 
Request 对 象 的 主要 方法 如 表 12-5 所 示 。 


表 12-5 Request 对 象 的 主要 方法 


方 法 说 明 
request.full_url request 对 象 的 URL 
Tequesthost 主机 地 址 和 主机 端口 号 
request.data 将 要 向 服务 器 发 送 的 数据 (如 账号 、 密 码 等 ) 
request.method 数据 传输 方式 (POST 或 GET) 
request.add_data(data) 向 request 对 象 中 添加 传输 数据 
request.add_header(key,val) 向 request 对 象 中 添加 头 文件 


【 例 12-$】Request 对 象 使 用 示例 : 


import urllib.request as rq 
import urllib.parse 


headers = {'User-Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows 
NT)', 'Referer': 'http://www.zhihu.com/articles'} 


values = {"username":"1016903103@qq.com", "password": "XXXX"} 
data = urllib.parse.urlencode (values) 

url = "https://passport.csdn.net/account/login? 
from=http://my.csdn.net/my/mycsdn" 

request = rq.Request (url,data.encode () ,headers) 

response = rq.urlopen (request) 

print (response.read() .decode ("utf-8")) 


在 上 面 的 代码 中 ， 需 要 向 服务 器 提交 账号 密码 表单 ， 在 传递 表单 信息 前 ， 还 需要 使 用 
urllib.parse.urlencode() 函 数 进行 数据 格式 转换 ， 然 后 再 将 格式 转换 后 的 数据 传 入 urlopen。 

当然 ， 在 实际 登录 的 过 程 中 ， 可 能 还 需要 流水 段 字 号 或 者 验证 码 等 ， 因 而 ， 运 行 上 面 
的 代码 并 不 会 真 的 登录 成 功 。 

如 果 读 者 有 兴趣 ， 可 以 阅读 相关 资料 ， 学 习 相关 的 操作 。 























mm Python 程序 设计 实用 教程 


12.5 案例 实 训 : 设计 获取 网 站 热点 要 闻 的 网 络 息 虫 程序 





后 [ 




















介绍 了 与 网 络 爬 虫 相 关 的 知识 ， 下 面 将 以 本 章 前 述 内 容 为 基础 ， 并 结合 前 面 几 章 











程序 的 执行 流程 如 下 。 


(1) 
(2) 
G3) 
(4) 
(5) 
(0) 
(7) 


登录 “东方 头条 ”网 站 ， 并 获取 服务 器 返回 的 网 页 源 代码 。 

获取 源 代码 中 所 有 热点 新 闻 的 URL。 

怜 取 热点 新 闻 的 URL 并 从 中 提取 出 所 有 的 新 闻 图 片 。 

对 于 包含 “下 一 页 ”链接 的 热点 新 闻 ， 再 次 提取 所 有 子 页 URL， 并 提取 信息 。 
保存 图 片 文 件 到 本 地 文件 夹 。 

保存 文字 信息 到 本 地 形成 文本 文档 。 

重复 (3)~(6) 步 ， 直 到 所 有 热点 新 闻 的 URL 都 被 访问 完毕 。 


下 面 先 讲解 三 个 关键 步 又， 然后 给 出 爬虫 程序 的 完整 代码 。 
1. 打开 《东方 头条 》 网 站 ， 通 过 正则 表达 式 匹 配 热点 新 闻 的 URL 
前 面 已 经 介绍 过 打开 一 个 网 站 并 返回 网 站 源 代码 的 方法 : 只 需要 使 用 -urlopenO) 函 数 打 


开 网 页 ， 


并 通过 .read().decode(“utf-8”) 方 法 ， 即 可 返回 一 个 utf-8 格式 的 网 页 源 代码 文件 。 


具体 代码 如 下 : 


import urllib.request as rq 


uop = rzq.urlopen("http://mini.eastday.com/"，timeout=100) # 打 开 起 始 网 页 

data = uop.read() .decode ("utf-8") 

print (data) 

但 从 图 12-3 可 以 看 到 ， 返 回 的 源 代码 是 杂乱 的 ， 想 从 中 提取 出 热点 新 闻 区 域 是 很 麻烦 
的 。 这 时 ， 如 果 使 用 的 浏览 器 支持 审查 元 素 功 能 ， 也 可 以 利用 这 一 功能 帮助 我 们 快速 地 确 
定 目标 元 素 的 位 置 ， 如 图 12-4 所 示 。 





热点 更 喇 天 医 妾 ?pst 
在 新 标 等 页 中 打开 (D 一 
在 新 窗口 中 打开 W) 
。 今 年 。 在 褒 路 J 记 口中 JG@) 普遍 关心 的 问题 
过 去 一 目标 另存 为 (4) 次 点 了 " 洪 凶 "的 名 
添加 收藏 夫 {E). 
. 逃 过 实际 处 蜀 
各 me 区 i 多 
民法 文字 | 
* 韩 美 “参与 模拟 军 演 
广 马 核 。 使 用 i 盏 下 载 和 不 模 与 加 骨 疡 交 
个 全 部 疾 计 
Tm 
= — ss 引 彩 公司 ,不 想 当 导演 
抬 性 (P) 
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使 用 审查 元 素 的 功能 ， 可 以 看 到 如 图 12-5 所 示 的 格式 十 分 工整 的 HTML 代码 。 需 要 
的 新 闻 内 容 包 含 在 <div id=“] hot news”class“hot-news clearfix”> 标 签 中 ， 再 次 通过 单 击 标 
签 前 面 的 三 角 就 可 以 很 清晰 地 看 到 ， 需 要 提取 的 URL 信息 和 新 闻 标 题名 在 子 标签 <a> 中 和 
<a> 与 </a> 之 间 。 通 过 使 用 第 2 章 2.8 节 介 绍 的 正则 表达 式 匹 配方 法 ， 可 以 从 中 提取 信息 。 
















px 有 好 开局 ”总理 的 工作 报 入 首 ) 





5pan 395px w 


* 北京 地 铁 辱 吉他 人 男子 仅 17 岁 六 入 演 实 际 处 列 


MR 


Oo Nee) Newok Sources Timeline Profles Resources Audis Censole oo 阁 口 x 
内 网 start -> 四 


_news” class="hot-news clearfix"> Suee EE LS 


4 时 多 是 
ye ( 





href»"//mint .eastday.con/a/ -nav-fixed { cpmmon. C537129170122:3 


















datae”index|hotnews|0|0” targetv a 
” 年 GDP 预期 丧 长 6. SY 则 法 科普 遇 关 志 的 问题 -> Dott: 
《Span》 今 : 期 增长 6.5% 饰 决 糙 众 普 党 关 心 的 问题 </ span> top: 09; 
eA lass>e/4> 2 ndex: 9999; 
de pert 
局 ep cassrrtislermwrap clearfixry wereey 
agorvtitle-sa 人 ”hrefw“/1aini .eastday.coeyal or- 
所 170306040345056. html” pd jex |hotnews [410™ target= ~ pennterntt dniment toementtt 
从 boy Eee 
荐 mav_cnt ( oemon. C44729179122:1 
ontain detaall cnt contain ce Su) (Cancel width: 190%; 


12-5 显示 代码 
通过 实验 ， 代 码 如 下 : 


import urllib.request as rq 
import re 
uop = rq.urlopen ("http://mini.eastday.com/"，timeout=100) # 打 开 起 始 网 页 
data = uop.read() .decode ("utf-8") 
pattern = re.compile('<a class="title-lg" href="(.+2)".*?title="(.+?)">') 
# 提 取 热 点 要 闻 的 所 有 新 闻 URL 
items = re.findall (pattern, data) 
for item in items: 
print(str(item[1])+" : "+str(item[0])) 


其 中 ， 正 则 表达 式 中 的 第 一 个 (+?) 中 保存 的 是 URL 地 址 ， 新 闻 的 标题 内 容 保存 在 第 
二 个 (+?) 中 ， 对 应 于 匹配 结果 中 的 item[0] 和 item[1]， 输 出 结果 如 图 12-6 所 示 。 经 人 工 对 
比 匹配 结果 和 网 页 内 容 ， 确 定 所 有 的 热点 新 闻 都 已 被 匹配 到 了 。 


今年 GDP 预 期 增长 6. 5% 解决 群众 普 记 关心 的 问题 : //mini eastday. con/a/170306011009603. htnl 
北京 地 铁 辱骂 他 人 郧 子 仅 17 岁 或 将 逃 过 实际 处 罚 : //mini. eastday. com/a/170305215850805. html 

幕 美 启动 最 大 规模 联合 军 演 &quot; 萨 德 &quot; 参 与 模拟 军 演 : //nini. eastday. com/a/170306070253127. html 
恒 大 战国 安 连续 7 场 不 败 卫 坚 之 旅 从 玩 敌 身上 开启 : //mini. eastday. con/a/170306081806592. htnl 

政府 工作 报告 传递 2017 年 中 国 发 展 八大 信号 : //mini. eastday. con/a/170306074104071. htnl 

境外 媒体 称 台湾 紧 盯 大 陆 西 太 军 演 : 忧 大 陆军 力 增强 : //mini. eastday. con/a/170306083911989. htnl 
张国立 在 两 会 提 了 个 建议 被 台湾 记者 堵 厕 所 质问 : //mini. eastday. com/a/170306070231435. html 

澳门 有 “旅游 警察 ”了 : 驻守 观光 区 保障 出 行 安全 : //mini. ea 中 day. com/a/170306011043728. html 
沪 上 有 旧书 业 “ 换 一 种 活 法 ”: 所 有 人 都 是 旧书 经 营 者 : //mini. eastday. com/a/170306051046482. html 
成 都 发 现 “ 地 下 青铜 器 宝库 ” 源 于 春秋 战国 时 期 : //mini. eastday. com/a/170306011048234. html 
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千 注意 :， 作 为 网 站 的 开发 者 和 维护 者 ， 并 不 希望 他 人 编写 爬虫 程序 随意 爬 取 网 站 的 内 
容 ， 所 以 网 站 可 能 会 定期 或 不 定期 地 变换 网 页 源 文件 格式 ， 甚 至 会 更 换 编码 
方式 。 这 对 编写 爬虫 程序 而 言 的 确 是 一 种 挑战 ! 有 鉴于 此 ， 实 际 爬 取 网 页 
时 ， 尚 需 根据 实际 情况 重新 构造 用 于 提取 文本 的 正则 表达 式 ， 否 则 可 能 达 不 
到 网 页 扑 取 的 目的 。 换 言 之 ， 本 书 提供 的 程序 在 调试 时 能 够 正常 爬 取 网 站 内 
容 ， 但 并 不 意味 着 网 站 更 新 后 一 定 能 够 正常 爬 取 ， 有 可 能 需要 重新 编写 正则 
表达 式 ， 甚 至 尝试 更 换 一 下 编码 方式 。 本 节 程 序 在 调试 过 程 中 已 遇 到 了 这 样 
的 难题 。 


2. 打开 热点 新 闻 URL， 从 中 提取 信息 


在 图 12-6 中 ， 可 以 发 现 所 有 的 URL 都 是 不 全 的 ， 都 缺少 前 面 的 “http:” 这 可 能 是 网 
站 编写 时 的 习惯 ， 需 要 及 时 补 全 ， 以 免 无 法 访问 。 实 现 此 功能 的 具体 代码 如 下 


def info extract (data) : 
# 信 息 提取 函数 ， 用 来 提取 出 网 页 中 的 文本 和 图 片 
pattern= re.compile( 
'<div class="gg detail cnt clearfix" id="dsp btxf">(.*?)<div 
class="gg item bomttom cnt" id="dsp left2">') 
items = re.findall (pattern, data) # 在 网 页 中 提取 包含 信息 的 最 小 范围 
if items != []: 
pattern jpgl = re.compile('<img.*?src="(.*?)".*?>') # 提 取 图 片 
pattern jpg2 = re.compile("<img.*?src="' (.*?)'>") # 提 取 图 片 
jpg = re.findall (pattern jpgl, str(items[0])) 
jpg += re.findall (pattern jpg2, str(items[0])) 


Slse. 
Jpg = 
pattern text = re.compile("<p.*?>([^<].*?)</p>|<span.*?>(.*?)</span>") 
# 提 取 文 本 


text = re.findall (pattern text, str(items)) 
return (text,jpg) # 使 用 一 个 元 组 返回 找到 的 图 片 和 文本 列表 


for item in items: 
text = [] 
URL = "http:" + str(item[0]) # 完 整 的 URL 格式 
uop = rq.urlopen (URL, timeout=100) # 打 开 新 闻 URL 开始 提取 信息 
data = uop.read() .decode ("utf-8") 
pattern next = re.compile('<a href="(.*?)">\d</a>')# 提 取 新 闻 的 下 一 页 URL 
next = re.findall (pattern next, data) 
response = info extract (data) # 调 用 info extract () 函数 提取 新 闻 网 页 中 的 信息 
text = text + response[0] 
jpg = jpg+response[1] 


if len (next) != 0: # 如 果 下 一 页 URL 的 提取 结果 不 为 空 ， 继 续 提取 信息 
Eon i ja range (0, len (next)): 
next Url = str(URL) .replace(".html", "-"+str(i+2)+".html") 
# 完 整 子 页 URL 
uop = rq.urlopen (next url, timeout=100) 
data = uop.read() .decode ("utf-8") 
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response = info extract (data) # 获 取 子 页 信息 
text = text + response[0] 
jpg = jpg + response[1] 
print (text) 
print (jpg) 
下 面 对 上 述 代码 做 几 点 说 明 。 首 先 通过 .urlopen() 方 法 打开 URL。 因 为 有 的 新 闻 内 容 较 
多 ， 可 能 存在 子 页 ， 所 以 还 需 提取 出 所 有 的 子 页 URL。 将 提取 信息 的 代码 定义 为 函数 
info_extract(data) ， 该 函数 将 匹配 到 的 文本 内 容 和 图 片 以 元 组 的 形式 返回 。 然 后 ， 通 过 
text、jpg 列表 收集 每 条 热点 新 闻 子 页 的 所 有 文本 信息 和 图 片 地 址 。 最 后 ， 加 入 一 个 for 循 
环 处 理 所 有 的 URL。 


3. 保存 数据 到 本 地 


至 此 ， 所 有 热点 新 闻 的 数据 均 已 收集 到 了 ， 最 后 一 步 是 将 所 有 数据 保存 到 本 地 。 相 关 
操作 在 第 5 章 文件 与 异常 处 理 中 已 介 绍 过 ， 代 码 如 下 : 


import os 
import urllib.request 











def file name (Title): 


# 文 件 名 过 滤 函 数 ， 滤 掉 标 题 中 不 合理 的 字符 


Title = str(Title) .replace ("?2"，"") 
Title = str(Title) .replace ("™*", "") 
Title = str(Title) .replace("™:", "") 
Title = str(Title) .replace ("<", "") 
Title = str(Title) .replace (">", "") 
Title = str(Title) .replace ("|", "") 
Title = str(Title) .replace ("gquot;", "") 


return Title 


path = os.getcwd() # 查 看 当前 路 径 
title = file name (item[1]) 坦 设 置 保存 的 文件 名 
add = path + "\\" + title 间 设 置 保存 路 
isExists = os.path.exists (add) 
if not isExists: # 在 当前 路 径 创 建文 件 夹 ， 如 果 没 有 同名 文件 夹 则 新 建 
os.makedirs (add) 
f = open(add + "\\" + title + ".txt", 'w') # 保 存 文 本 
for dn text: 
ee es 
f.write(str(j)) 
f.close() 


n= 
for image in images: 
trY: 间 因 为 图 片 可 能 打 不 开 ， 所 以 使 用 try 使 程序 继续 执行 
u = urllib.request.urlopen("http:" + str(image)，timeout=10) 
斐 访问 图 片 
file = u.read() 
f= open(add + "\\" + str(n) + ".jpg", 'wb') 井 保存 图 片 
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f.write (file) 
f.close() 
n=n+1 

except Exception as e: 
pass 


程序 解释 : 首先 使 用 os.getewd0 方 法 获取 当前 的 文件 路 径 ， 将 新 闻 的 标题 作为 文件 夹 
和 文本 文档 的 文件 名 ， 使 用 一 个 fle_nameO 函 数 规范 化 文件 名 。 然 后 ， 使 用 os.makedirs() 
函数 按照 新 闻 标题 建立 文件 夹 ， 并 将 文本 文档 和 图 片 保存 到 该 文件 夹 下 。 

4. 网 络 惟 虫 程序 的 完整 代码 


最 后 附 上 网 络 爬 虫 程序 的 完整 代码 ， 以 供 读者 参考 。 
用 于 疏 取 “东方 头条 ”热点 新 闻 的 简单 网 络 怜 虫 程序 : 


import urllib.request as rq 
import urllib.parse 

import re 

import os 








def info extract (data): 
# 信 息 提取 函数 ， 用 来 提取 出 网 页 中 的 文本 和 图 片 
pattern= re.compile( 
"<div class="gg detail cnt clearfix" id="dsp btxf">(.*?)<div 
class="gg item bomttom cnt" id="dsp left2">') 
items = re.findall (pattern, data) # 在 网 页 中 提取 包含 信息 的 最 小 范围 
if items != []: 
Pattern jpgl = re.compile('<img.*?src="(.*?)".*?>') # 提 取 图 片 
pattern jpg2 = re.compile("<img.*?src="' (.*?)'>") # 提 取 图 片 
jpg = re.findall (pattern jpgl, str(items[0])) 
jpg += re.findall (pattern jpg2, str(items[0])) 


else 
Ia I 
pattern text = re.compile("<p.*?>([^<].*?)</p>|<span.*?>(.*?)</span>") 
# 提 取 文 本 


text = re.findall (pattern text, str(items)) 


return (text,jpg) # 使 用 一 个 元 组 返回 找到 的 图 片 和 文本 列表 


def image save (images) : 
# 图 片 保存 函数 
n=0 
for image in images: 
try: 间 因 为 图 片 可 能 打 不 开 ， 所 以 使 用 try 使 程序 继续 执行 
u = urllib.request.urlopen ("http:" + str(image)，timeout=10) 
# 访 问 图 片 
file = u.read() 
f= open(add + "\\" + str(n) + ".jpg", "wb') 井 保 存 图 片 
f.write (file) 
f.close() 
n= 
except Exception as e: 


def file 


pass 


name (Title): 


# 文 件 名 过 滤 函 数 ， 渡 掉 标 题 中 不 合理 的 字符 


Title = 
Title 
Title 
Title 
Title 
Title 
Title 
retur, 


# 驱 动 


if name == ' main 
rq.urlopen ("http://mini.eastday.com/", 


uop = 
data 
patte 


str (Title) 


= str(Title). 


= str(Title) 


= str(Title). 
= str(Title). 


= str(Title) 
= str(Title) 
n Title 


:replace ("2", 
replace (™*", 
.replace(":", 
replace ("<", 
replace (">", 
:replace ("|", 
-replace ("gquot;" 


rh 
| 
mm) 
mm) 
mm) 


mm) 


= uop.read() .decode ("utf-8") 


rn = re.compile('<a class="title-1g" 


href="(.+2?)".*?2title="(.+2)">') 


items 


path = 


Es 


os.getcwd() 


tem in items: 


text = [] 
Hpge = 


OBE 三 


"http:" + str(item[0]) 


title = file name (item[1]) 


add = path + "\\" + title 井 设 置 保存 路 
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timeout=100) # 打 开 起 始 网 页 


# 提 取 热 点 要 闻 的 所 有 新 闻 URL 
= re.findall (pattern, data) 
坦 查看 当前 路 径 


# 完 整 的 URL 格式 
# 设 置 保存 的 文件 名 


isExists = os.path.exists (add) 


# 在 当前 路 径 创 建文 件 夹 ， 如 果 没 有 同名 文件 夹 则 新 建 


if not isExists: 


uop = 


os.makedirs (add) 


rq.urlopen (URL, timeout=100) 
data = uop.read() .decode ("utf-8") 


data = str(data) .replace("\n", 
pattern next = 


# 提 取 新 闻 的 下 一 页 URL 


next = re.findall (pattern next, data) 


response = info extract (data) 


# 调 用 info extract () 函数 提取 新 闻 网 页 中 的 信息 


text = text + response[0] 


jpg = 


if len (next) 
for i in range(0, len(next)): 
= str(URL) .replace (" .html"， 


next url 


N= 0 


jpg + response[1] 


# 完 整 子 页 URL 
uop = rq.urlopen (next url, timeout=100) 


data = uop.read() .decode ("utf-8") 


# 如 果 下 一 


mn) 


# 打 开 新 闻 URL 开始 提取 信息 


re.compile('<a href="(.*?)">\d</a>') 


页 URL 的 提取 结果 不 为 空 ， 继 续 提取 信息 


n-"+Str (i+2)+".html") 
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data = strl(data) .replace("\n"，"") 

response = info extract (data) # 获 取 子 页 信息 
text = text + response[0] 

jpg = jpg + response[1] 


于 = open(add + "\\" + title + ".txt", 'w') 埋 保 存 文 本 
for i in text: 
For dn Ls 
f.write (str (j)) 
f.close() 


image save (jpg) # 保 存 图 片 
print ("信息 保存 成 功 : " + title) 
print (" 东 方 头条 热点 要 闻 疏 取 完毕 。") 


运行 结果 如 图 12-7 所 示 ， 收 集 到 的 数据 已 被 成 功 地 保存 到 本 地 文件 夹 中 ， 如 图 12-8、 
图 12-9 所 示 。 


信息 保存 成 功 : 建 军 90 周 年 大 会 举行 习近平 出 席 并 发 表 讲话 
信息 保存 成 功 : 31 省 区 市 上 半年 CDP 出 炉 各 省 区 市 均 富 可 政 国 
信息 保存 成 功 : 7 省 份 环保 问题 清单 出 炉 多 地 假装 治 污 被 点 名 
信息 保存 成 功 : 这 100 人 进入 秦 城 监狱 面试 名 单 有 岗位 仅 限 女 性 
信息 保存 成 功 : 亚 裔 男子 在 中 国 驻 洛杉矶 总 领 馆 开 枪 随后 自杀 
信息 保存 成 功 : 朝鲜 谴 贡 美国 会 通过 新 一 轮 对 朝 制裁 议案 无 下 
信息 保存 成 功 : 土耳其 政变 最 大 规模 审判 近 500 名 头目 被 押 出 场 
信息 保存 成 功 : 中 国 在 东海 进行 移动 式 挖掘 船 作业 日 方 提 抗 议 
信息 保存 成 功 : 瓜农 制止 偷窃 被 刺 死 获 荣誉 称号 家 属 获奖 10 万 
信息 保存 成 功 : 深 大 失 联 女生 在 港 盗 窃 被 捕 辅导 员 谁 都 会 犯错 
信息 保存 成 功 : 北京 现 灵魂 画 手 20 元 完全 不 像 创作 不 看 人 
东方 头条 热点 要 闻 怜 取 完毕 。 


12-7 ”程序 运行 日 志 








7 络 份 环保 问题 请 四 内 关 直 半 全 0j 1 2 
单 出 入 多 地 和 法 ES jpg jpg 
治 ;5 被 点 各 了 议 宝 无 由 
| 和 | 
3jpg 4jpg Sjpg 
瓜农 制止 答 穿 被 建 军 90 周 年 大 会 深 大 失 联 女生 在 十 本 时 政变 最 大 
制 死 获 荣 蕉 称号 举行 习近平 出 席 港 盗 柯 被 柄 辅导 规模 市 判 近 500 tt 
家 局 获奖 10 万 并 发 表 讲 活 员 谁 部 会 犯错 名 头目 被 祁 出 场 
兰芝 
6jpg 亚 商 男 子 在 中 国 
亚 积 男 了 在 中 国 ”这 100 人 进入 过 。。 中 国 在 东海 进行 en2.6py 
了 有 杉 册 总 领 谊 。。 城 交 移动 式 榨 所 各 作 驻 洛 杉 矶 总 领 馆 
开始 肚 后 自杀 有 疯 位 仅 限 妆 性 业 日 方 提 搞 汉 开 枪 随后 自杀 .bt 
12-8 ”保存 耻 取 数据 的 文件 夹 12-9 疏 取 的 图 片 文件 
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第 12 章 网络 纺 科 人 


本 章 小 结 


本 章 主要 介绍 了 如 何 使 用 Python 进行 网 络 编程 。 因 为 socket 是 很 多 其 他 通信 类 库 的 基 
础 ， 也 是 网 络 通信 的 基础 ， 所 以 本 章 先 以 一 个 端口 扫描 器 为 例 讲解 了 socket 的 使 用 。 之 
后 ， 通 过 一 个 简单 的 网 络 怜 虫 例子 讲解 了 urllib 库 的 使 用 。 使 用 urllib 库 ， 可 以 帮助 我 们 快 
速 地 抓 取 网 页 信息 ， 大 大 地 提高 信息 获取 效率 。 本 章 最 后 通过 一 个 获取 “东方 头条 ”网 站 
热点 要 闻 的 网 络 怜 虫 程序 ， 将 前 面 几 章 所 学 的 内 容 进 行 了 回顾 和 综合 应 用 ， 旨 在 通过 一 个 
案例 实 训 帮 助 读者 学 以 致 用 。 


























习 ”是 
1. 填空 题 


(1) Internet 采用 一 种 全 局 通用 的 地 址 格式 ， 为 网 络 中 的 每 一 台 主机 都 分 配 一 个 唯一 的 
地 址 ， 该 地 址 称 为 ( 和 
(2) Intemet 使 用 ( ) 来 管理 计算 机 域名 与 卫 地 址 的 对 应 关系 。 
(3) IP 地 址 用 来 标识 Internet 上 的 主机 ， 而 位 于 Internet 主机 上 的 资源 (如 各 种 文档 、 
图 像 等 ) 则 通过 ( ) 来 标识 。 
(4) TCP/IP 协议 的 传输 层 包含 两 个 传输 协议 : 面向 连接 的 ( ) 和 非 面 向 连接 的 
( )。 
(5) 创建 服务 器 端 socket 对 象 并 绑 定 到 IP 地 址 后 ， 可 以 使 用 ( ) 和 ( ) 对 象 
方法 进行 侦 听 和 接收 连接 。 
(6) 客户 端 socket 对 象 通过 ( ) 方 法 尝试 建立 到 服务 器 socket 对 象 的 连接 。 
2. 选择 题 
(1) TCP/IP 协议 参考 模型 把 所 有 的 TCP/IP 系列 协议 归 类 到 4 个 抽象 层 中 ， 这 4 个 层 
按照 由 高 到 低 分 别 为 ( )。 
A. 应 用 层 、 传 输 层 、 网 络 层 和 链 路 层 
B. 链 路 层 、 网 络 层 、 传 输 层 和 应 用 层 
C. 应 用 层 、 网 络 层 、 传 输 层 和 链 路 层 
D. 链 路 层 、 传 输 层 、 网 络 层 和 应 用 层 
(2) 一 般 情况 下 ，Web 服务 器 可 能 位 于 计算 机 的 TCP( 。 ) 端 口 。 


A.25 B.21 C.80 D. 102 
(3) 在 ullib 库 中 ,我 们 常用 (  ”) 子 模块 打开 URL 来 访问 网 页 。 

A. parse B. rebotparser C. error D. request 
3. 问答 题 


(1) 简 述 socket 通信 的 连接 过 程 。 
(2) urllib 模块 包含 哪 4 个 子 模块 ， 简 述 其 分 别 实现 什么 功能 。 
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Python 关键 字 
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Python 3 中 的 关键 字 共 计 33 个 ， 它 们 是 : 


False 
None 
True 
and 

as 
assert 
break 


class finally is return 
continue for lambda try 
def from nonlocal while 
del global not with 
elif or yield 
else import pass 

except in raise 


各 关键 字 的 详解 如 表 A-1 所 示 。 





关键 字 


表 A-1 Python 关键 字 详 解 


详 解 





False 


class 


finally 


is 


return 


None 
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布尔 类 型 的 值 ， 表 示 假 ， 与 Tmue 相反 
定义 类 的 关键 字 
在 异常 处 理 的 时 候 添加 ， 有 了 它 ， 程 序 始终 要 执行 finally 里 面 的 程序 代码 块 ， 如 : 


class MyException (Exception) :pass 
try: 

#some code here 

raise MyException 
except MvException: 

print “MyException encoutered” 
finally: 

print “Arrive finally” 


Python 中 的 对 象 包含 三 要 素 : id、type、value， 其 中 id 用 来 唯一 标识 一 个 对 象 ，type 标识 
对 象 的 类 型 ，value 是 对 象 的 值 。is 判断 的 是 a 对 象 是 否 就 是 b 对 象 ， 它 是 通过 id 来 判断 
的 ;一 判断 的 是 a 对 象 的 值 是 否 和 b 对 象 的 值 相等 ， 它 是 通过 value 来 判断 的 。 如 : 


>>> a = 1 
>>> b = 1.0 
2>> US 
False 

>>> a = 
True 

>>> id(a) 
12777000 
>>> id(b) 
14986000 








吾 


return 语句 用 来 从 一 个 函数 返回 ， 即 跳出 函数 。 也 可 选 从 函数 返回 一 个 值 

None 是 一 个 特殊 的 常量 。None 和 False 不 同 ，None 不 是 0， 也 不 是 空 字符 串 。None 和 任 
何其 他 的 数据 类 型 比较 ， 永 远 返 回 False。None 有 自己 的 数据 类 型 NoneType。 可 以 将 
None 复制 给 任何 变量 ， 但 是 不 能 创建 其 他 NoneType 对 象 。 


>>> tvpe (None) 
<class ‘NoneType’> 
>>> None == "0 
False 

>>> None == 
False 

>>> None == None 
True 

>>> None == False 
Ealse 
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续 表 

关键 字 详 解 
continue “| continue 语句 被 用 来 告诉 Python 跳 过 当前 循环 体 中 的 剩余 语句 ， 然 后 继续 进行 下 一 轮 循环 
for for.. 加 着 呈 外 一 个 条 中 们 ， 它 在 一 序列 的 对 象 上 递归 ， 即 逐一 使 用 序列 中 的 每 个 项 目 

匿名 函数 是 个 很 时 艇 的 概念 ， 提 升 了 代码 的 简洁 程度 。 如 : 
lambda 9= lambda x: x*2 

g(3) 

可 以 使 用 try.…except 语句 来 处 理 异常 。 我 们 把 通常 的 语句 放 在 try 块 中 ， 而 把 错误 处 理 语 
3 句 放 在 except 块 中 
True 布尔 类 型 的 值 ， 表 示 真 ， 与 False 相反 

# 定 义 函数 

def hellof) : 

print (‘hello, Python’) 

本 # 调 用 函数 


hello() 
hello, Python 


from 在 Python 中 用 import 或 者 fom...import 来 导入 相应 的 模块 





nonlocal 关键 字 用 来 在 函数 或 其 他 作用 域 中 使 用 外 层 ( 非 全 局 ) 变 量 ， 如 : 


def make counter(): 
count = 0 
def counter(): 
nonlocal count 
count += 1 
return count 


nonlocal return counter 
def make counter test(): 
mc = make counter() 
print (mc ()) 
Print (mc ()) 
print (mc ()) 
i while 语句 允许 重复 执行 一 块 语句 。while 语句 是 所 谓 循环 语句 的 一 个 例子 。while 语句 有 
” ”| 一 个 可 选 的 else 从 句 
and 逻辑 “与 ”， 和 C 的 && 一 样 
del 用 于 list 列表 操作 ， 删 除 一 个 或 者 连续 几 个 元 素 。 如 : 
del a = [-1. 3.‘aa’. 851 人 个 


del ar01 +# 删 除 第 0 个 元 素 
del a[2:4] # 删 除 从 第 2 个 元 素 开始 ， 到 第 4 个 为 止 的 元 素 ， 包 括 头 但 不 包括 尾 


global 定义 全 局 变量 

not 逻辑 “ 非 ”， 和 C 的 ! 一 样 

with 是 Python 2.5 以 后 才 有 的 ， 它 实质 是 一 个 控制 流 语句 ，with 可 以 用 来 简化 try-finally 
语句 。 它 的 主要 用 法 是 实现 一 个 类 ”enter _0 和 _ exit 0 方法 ， 如 : 


class controlled execution: 
def enter (self): 
with set things up 
return thindq 
def exit (self, type, value, traceback): 
tear thing down 
with controlled execution() as thing: 
Some code 
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续 表 

关键 字 详 解 
as 结合 with 使 用 
elif 和 站 配合 使 用 
注 站 语句 用 来 检验 一 个 条 件 ， 如 果 条 件 为 真 ， 运 行 一 语句 块 ( 称 为 f 块 )， 否 则 处 理 男 外 一 语 

句 块 ( 称 为 else 块 )。else 子 句 是 可 选 的 
or 逻辑 “或 ”， 和 C 的 一样 

yield 是 关键 字 ， 用 起 来 像 retum，yield 在 告诉 程序 ， 要 求 函数 返回 一 个 生成 器 ， 如 : 

def createGenerator () : 
yield mylist = range(3) 

for i in mylist: 

yield i*1i 

断言 ， 这 个 关键 字 用 来 在 运行 中 检查 程序 的 正确 性 ， 和 很 多 其 他 语言 是 一 样 的 作用 。 如 : 
ansert assert len(mylist) >= 1 
else 与 让 关键 字 配 合 使 用 ， 但 else 子 句 不 是 必需 的 

在 Python 中 用 import 或 者 from...import 来 导入 相应 的 模块 ， 如 : 
import from svs import * 

print (‘path:’,path) 

pass 的 意思 是 什么 都 不 要 做 ， 作 用 是 为 了 弥补 语法 和 空 定义 上 的 冲突 ， 其 好 处 体现 在 代码 

的 编写 过 程 之 中 ， 比 如 你 可 以 先 写 好 软件 的 整个 框架 ， 然 后 再 填 好 框架 内 具体 函数 和 
a class 的 内 容 ， 如 果 没有 pass 编译 器 会 报 一 堆 的 错误 ， 让 整个 开发 过 程 很 不 流畅 ， 如 : 

def f(arg): pass #a function that does nothing (yet) 

class C: pass #a class with no methods (yet) 

break 语句 是 用 来 终止 循环 语句 的 ， 即 哪怕 循环 条 件 没有 成 为 False 或 序列 还 没有 被 完全 递 
break 归 ， 也 停止 执行 循环 语句 。 

一 个 重要 的 注释 是 ， 如 果 从 for 或 while 循环 中 终止 ， 任 何 对 应 的 循环 的 else 块 将 不 执行 
except 使 用 try 和 except 语句 来 捕获 异常 
in for..…in 是 另外 一 个 循环 语句 ， 它 在 一 序列 的 对 象 上 循环 ， 即 逐一 使 用 队列 中 的 每 个 项 目 
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Python 的 raise 和 Java 的 throw 很 类 似 ， 都 是 抛 出 异常 。 如 : 


class MyException (Exception) :pass 
EY 

#some code here 

raise MyException 
except MvException: 

print “MyException encoutered” 
finally: 

print “Arrive finally” 
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其 他 常用 功能 
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Python 的 一 大 优势 便 是 其 可 扩展 性 ， 在 此 基础 上 衍生 出 了 数量 庞大 的 第 三 方 扩展 库 ， 
因而 大 大 增强 了 Python 的 功能 。 
表 B-1 所 列 的 是 前 面 各 章 未 曾 提 到 的 其 他 一 些 常用 功能 。 






































表 B-1 Python 的 其 他 常用 功能 
功 能 第 三 方 扩展 库 说 明 下 载 地 址 
threads 概念 ， 资 源 开销 y " 
多 线程 处 理 | eventlet 使 用 green threads 概 源 开销 http://eventlet.net/ 
很 少 
St 其 消息 机 制 与 MFC 颇 为 相似 。 入 门 | http://www.wxpython.org/ 
界面 编程 wxPythr 
加 简单 ， 适 全 快速 开发 应 用 
可 执行 文件 | py2exe 将 Python 脚本 文件 打包 成 Windows | http://www.py2exe.org/ 
生成 | (Python to EXE 下 的 exe 文件 
图 像 增 强 、 滤 波 、 几 何 变换 以 及 序 | http://pythonware.com/ 
i A 列 图 像 处 理 ， 支 持 数 十 种 图 像 格 | products/pil/ 
图 像 处 理 ee 外。 | 式 。 可 直接 载 入 图 像 文件 、 读 取 处 
理 过 的 图 像 ， 或 通过 抓 取 方法 得 到 
的 图 像 
跨 平台 地 获取 和 控制 系统 的 进程 ， ://code. > 
系统 资源 使 二 获 提 制 双 统 和 http: tele a 
用 信息 获取 pstuil 读 取 系统 的 CPU 占用 、 内 存 占用 以 | p/psutil/ 
> 及 磁盘 、 网 络 、 用 户 等 信息 
具有 图 像 处 理 和 计算 机 视觉 方面 的 | http:/openev.org/ 
计算 机 视觉 pe 很 多 通用 算法 ， 可 用 于 人 脸 识 别 、 | downloads html 
| 物体 识别 、 运 动 跟踪 、 机 器 视 党 、 
动作 识别 、 运 动 分 析 等 
三 维 可 视 化 | VIK 三 维 计算 机 图 形 学 、 图 像 处 理 和 可 | http://vtk.org/get-software. 
视 化 php 
医学 图 像 i 用 于 处 理 医学 图 像 ， 有 丰富 的 图 像 | http://www.itk.org/ 
处 理 分 割 与 配 准 的 算法 程序 HIML/Download .htm 
开源 数据 库 于 _ http://sourceforge.net/ 
连接 MySQLdb 对 开源 数据 库 MySQL 的 支持 后 
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